기금넷 공식사이트 - 회사 연구 - 군견망 여론 모니터링 시스템 핵심기술
군견망 여론 모니터링 시스템 핵심기술
군견망 여론감시체계의 핵심기술은 인터넷 정보수집 기술, 자연어 지능처리 기술(텍스트 마이닝 기술), 전문 검색 기술, 여론 활용 기술이다.
1.1 인터넷 정보 수집 기술
1.1.1 강력한 정보 수집 기능
강력한 정보 수집 기능은 다른 모든 기능을 보장합니다. 수집 기술이 부족한 제품은 효과적인 여론 모니터링 결과를 얻기 어렵습니다. 군견의 데이터 수집 및 데이터 마이닝은 전체 업계에서 1위를 차지하며 심층적인 정보 처리를 강력하게 보장합니다.
1.1.2 다양한 네트워크 사업자 모니터링 지원
주요 검색엔진, 뉴스포털, BBS, 블로그, 게시판, 웨이보, 동영상, 검색, 문서 모니터링 가능
1.1.3 메타데이터 검색 기능
메타검색 엔진은 다양한 성능과 스타일의 검색 엔진을 통합하고 몇 가지 새로운 쿼리 기능을 개발합니다. 하나의 메타 검색 엔진을 확인하는 것은 여러 개의 독립적인 검색 엔진을 확인하는 것과 같습니다. 메타서치는 네트워크 정보를 검색하고 수집할 때 검색 조건을 지정할 수 있어 정보 수집의 타당성을 향상시킬 뿐만 아니라 수집 범위를 넓혀 절반의 노력으로 두 배의 결과를 얻을 수 있습니다. 1.1.4 18,000개 모니터링 웹사이트 내장
과도한 구성 없이 18,000개 웹사이트를 쉽게 모니터링할 수 있습니다.
1.1.5 다양한 언어 및 인코딩으로 웹사이트를 모니터링할 수 있습니다.
언어 및 웹사이트 인코딩 자동 인식을 구성할 필요가 없습니다.
1.1.6 지능형 정보 추출 기술
웹 콘텐츠 지능형 추출 기술은 웹 페이지에서 효과적인 정보를 효과적으로 추출하고 웹 페이지의 제목, 텍스트 등의 정보 항목을 구별하고 분석할 수 있습니다. 웹 페이지의 콘텐츠 연속성을 통해 여러 웹 페이지의 콘텐츠를 자동으로 병합하고 온라인 포럼 등에서 자동으로 정보를 추출합니다.
1.1.7 구조화된 수집 기술
비구조화된 웹페이지 데이터 수집 시 구조화된 정보 추출 및 데이터 저장을 수행하여 다차원 정보 마이닝 및 통계 요구 사항을 충족합니다.
1.1.8 전천후 중단 없는 모니터링
정기적으로 또는 연중무휴로 모니터링할 수 있습니다. 실제 애플리케이션에서는 분 단위의 수집 및 업데이트가 가능합니다.
1.2 자연어 지능형 처리 기술
1.2.1 자동 단어 분할 기술
사전을 기반으로 한 단어 분할 기술을 사용하고 규칙과 통계를 결합하여 문제를 효과적으로 해결합니다. 문제 정확한 의미를 이해하세요. 확률 분석을 기반으로 한 언어 모델 방법을 종합적으로 활용하여 99%의 단어 분할 정확도를 달성했으며, 다양한 응용 분야에 따라 특정 요구 사항에 맞게 단어 분할을 수행할 수 있습니다.
1.2.2 자동 키워드 및 자동 요약 기술
텍스트 의미 분석을 기반으로 단어 빈도, 품사, 위치 정보를 종합적으로 고려하여 정확한 자동 키워드 및 자동 요약을 구현합니다. . 동시에 초록을 더 읽기 쉽게 만들기 위해 아나포라 해상도와 같은 기술이 사용됩니다.
1.2.3 자동 분류 기술
사람의 개입이 필요 없는 자동 분류 기술은 비정형 정보의 처리 효율성을 효과적으로 향상시킬 수 있습니다. 텍스트 분류는 텍스트 내용을 기반으로 컴퓨터를 분류하는 기능을 말합니다. Zhongke의 클릭 자동 분류 기술에는 다음 두 가지 분류 방법이 포함됩니다.
A 내용 기반 자동 텍스트 분류
B 규칙 기반 텍스트 분류
1.2.4 자동 클러스터링 기술
자동 클러스터링 기술은 유사성 알고리즘을 기반으로 한 자동 클러스터링 기술로, 분류되지 않은 다수의 문서를 자동으로 분류하고 유사한 내용을 가진 문서를 하나의 카테고리로 묶어 자동으로 주제어를 생성합니다. 카테고리 이름 결정. 여론 주제 자동 생성, 주요 뉴스 이벤트 추적 등에 사용할 수 있습니다.
1.2.5 유사 검색 및 중복 검사 기술
문서 "지문" 기반 텍스트 중복 검사 기술 대용량 데이터에 대한 정보 중복 검사를 지원합니다.
유사성 검색이란 주어진 샘플 텍스트에 대해 텍스트 모음에서 유사한 내용을 가진 다른 텍스트를 찾는 기술을 말합니다. 실제 적용에서는 여론정보 내용이 거의 동일한 기사가 많아 여론정보의 강조가 줄어들고, 기사주제의 유사성을 바탕으로 특보, 배경분석 등이 구성되는 것으로 나타났다.
1.3 지능형 검색 기술
이 시스템의 전체 텍스트 엔진은 기존의 전체 텍스트 검색 기술과 최신 WEB 검색 기술을 결합하여 검색 엔진의 성능 지표를 크게 향상시킵니다. 동시에 다양한 관련 기술을 통합하여 풍부한 검색 방법과 동의어 및 기타 지능형 검색 방법을 제공합니다.
- 관련 기사
- Glory of Kings: GK가 WE를 꺾고 서부 컨퍼런스에서 마지막 플레이오프 자리를 확정했습니다. WE가 포기했나요?
- 왜 여성들은 칭다오 담산사에 가지 않나요?
- 2022년 봄 축제 갈라의 호스트는 누구인가요?
- cf 골드 m249 기관총 총알이 600발을 넘을 수 있는 이유 (다른 분들의 영상을 봤습니다)
- 45세 린루비도 늙었습니다! 체크무늬 슈트를 입고 행사에 참가한 그는 얼굴에 주름이 많아 더 나이들어 보인다.
- 사랑에 있어서 냉정한 폭력은 얼마나 아픈가(냉정한 폭력은 얼마나 강력한가)
- 스테인리스 가드레일 가격 소개
- 타오샤오싱의 법원 심리
- 남자들은 가슴이 어두워도 상관없나요?
- 소림사 십삼개는 과연 당왕 이세민을 구한 것일까요? 진실은 무엇일까요?