기금넷 공식사이트 - 펀드 투자 - 주명 MSRA 부원장은 중국 NLP 가 어떻게 세계 최고 수준에 올랐다고 생각합니까?

주명 MSRA 부원장은 중국 NLP 가 어떻게 세계 최고 수준에 올랐다고 생각합니까?

최근 중국 컴퓨터학회 (CCF) 에서 열린 제 6 회 자연어 처리 및 중국어 컴퓨팅 컨퍼런스 (NLPCC 217) 가 대련에서 성공적으로 열렸다. 국내 NLP 분야 최초의 국제지향 대회인 NLPCC 는 회의 형식, 참석자 수, 보고의 질 등 활기찬 기상을 보여 중국 NLP 를 국제로 이끌 기세를 보이고 있다. < P > 중국의 현재 NLP 의 발전 상황과 전망, NLP 방향에서의 CCF 노력, NLPCC 회의 발전을 깊이 파악하기 위해 레이펑망은 CCF 중국어 정보기술전문위원회 주임, 마이크로소프트아시아연구원 부원장 주명 (중국중문 정보학회 (CIPS) 상무이사이자 국제계산어학회 ACL 의 후임 의장이기도 함) 을 맡고 있다. < P > 이 글의 주요 내용은 주명 박사가 CCF 중국어 정보기술전문위원회 차원에서 NLP 연구 진척 및 중국 NLP 발전 현황 및 전망에 대한 심층적인 소개입니다. 그의 개회사는 < P > 현재 각국 정부 (미국 독일 일본 중국 등) 가 인공지능 계획을 세우고 있지만 중국은 인공지능에 대한 계획이 가장 분명하다. 국무원의' 중국 인공지능발전계획' (217 년 7 월) 과 총서기' 19 대 보고서' (217 년 1 월) 관련 내용과 결합해 중국이 인공지능의 발전을 두 단계로 계획하고 있다는 것을 알 수 있다 < P > 우리 국내의 자연어 처리는 국가의 인공지능 계획과 거의 일치한다. 즉, 우리는 22 년까지 세계 선진 수준에 진입해 23 년에는 세계 최고 수준에 이를 것으로 기대하고 있다.

선진수준과 정상급은 어떤 차이가 있나요? 선진 수준은 당신이 세계에서 가장 발달한 나라를 따르고 있고, 당신도 모든 핵심 기술을 장악하고 있지만, 당신은 핵심 기술의 제안자가 아니며, 즉 당신이 선두 주자가 아니라는 것입니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 진보명언) 최고 수준은 실제로 당신이 앞장서고 있습니다. 당신은 전 세계에 어느 방향으로 가고 있는지 알려주고, 당신은 중요한 이론적 모델을 제시했고, 다른 사람들은 폴로우에 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 성공명언) 차이가 바로 이 점에 있다. < P > NLP 분야에서 우리 중국은 현재 아주 좋은 추종자입니다. 국제상 (주로 미국) 이 어떤 기술이라도 나타나면 바로 습득을 배우고 빠르게 응용하여 미국보다 나쁘지 않습니다. 지금 차이는 우리가 먼저 이 기술과 방법을 제시한 것은 아니다. 그래서 우리 CCF 중문 정보기술 전문위원회는 지금도 기본적으로 세계 선진 수준이라고 할 수 있으며, 3 년 후인 22 년에는 세계 선진 수준에 전면적으로 이를 것으로 보고 있다. 이를 바탕으로 우리는 23 년 세계 최고 수준에 이를 것으로 기대하고 있다. 이것이 우리의 비전입니다. < P > 다음은 주명 박사의 심도 있는 해설입니다. 레이펑망은 인터뷰 내용에 따라 원의를 바꾸지 않는 간소화와 편집을 하여 독자를 대접했습니다. < P > 1, NLP 는 인지지능의 핵심 < P > 뇌봉망: NLP 는 전체 AI 분야에서 어떤 위치에 있습니까? < P > 주명: 최근 몇 년 동안 인공지능은 큰 계산, 큰 데이터, 알고리즘 모델 (심도 있는 학습으로 대표됨) 및 착지 장면의 4 대 요소가 완비되어 고속 발전의 시대로 접어들었다. 주요 발전 방향: 인식 지능과인지 지능. < P > 지각지능은 시각 (이미지), 청각 (음성) 등의 인식력이다. 이미지 인식 ImageNet 평가, 음성 인식 Switchboard 평가 등 인식 지능이 비약적으로 도약했다는 것은 누구나 알고 있습니다. 이들은 이미 이 테스트 세트에서 인간의 수준을 능가하고 있습니다. (윌리엄 셰익스피어, 윈스턴, 음성 인식, 음성 인식, 음성 인식, 음성 인식, 음성 인식, 음성 인식) 이 분야의 연구 진전은 또한 보안, 얼굴 인식, 물체 감지, 휴대폰, 스마트 홈 등의 장치에서의 음성 인식 응용 프로그램 등 많은 응용 프로그램의 발전을 촉진시켰다.

인지지능, 통속적으로' 이해할 수 있으면 생각할 수 있다' 는 것이다. 인지지능에는 언어 지능, 지식지도, 사용자 초상화 등 많은 것들이 있다. 이를 바탕으로 스마트 쓰기, 채팅 대화, 시 창작, 텍스트 생성, 게임 게임 등 여러 가지 애플리케이션을 지원합니다. 알파고 (AlphaGo) 가 대표하는 게임 시스템과 같이 잘 하는 것도 있습니다. 그러나 일부는 여전히 만족스럽지 않습니다. 현재 인지지능은 인식지능에 비해 전반적으로 심도 있는 학습을 도입하는 데 반박자를 떨어뜨렸지만, 현재는 분발하여 추격하는 상태에 있다. 예를 들어, 신경 기계 번역의 질이 좋아지고 채팅 시스템, 인간-기계 대화도 점점 좋아지고 있다. < P > 자연어 이해는 인지지능의 가장 핵심적인 위치에 있다. 그 진보는 지식지도의 진보를 유도하고, 사용자에 대한 이해 능력 향상을 유도하며, 전체 추리 능력을 더욱 발전시킬 것이다. 이를 바탕으로 채팅, 문제 해결, 번역, 대화 등도 모두 진보한다. 인지지능이 진보하고 인지지능의 진보가 더해지면 전체 인공지능이 더 발전할 것이다. < P > 빌 게이츠는 "언어이해는 인공지능 왕관의 명주" 라고 말했고, 심향양 박사도 "언어를 아는 사람이 천하를 얻는다" 고 말했다. 모두 NLP 의 중요성을 강조하고 있다. 자연어 처리 기술은 인공지능 전체의 진전을 촉진하여 인공지능 기술을 착지 실용화할 수 있게 한다. < P > 2, NLP 향후 5 ~ 1 년 발전 < P > 뇌봉망: NLP 는 향후 5 ~ 1 년 동안 어떻게 발전할까요? < P > 주명: 대략 몇 가지 방향이 있습니다. 1) 질문과 독해력의 진보로 검색 엔진이 더욱 정확해집니다. 2) 음성 인식과 신경기계 번역은 구어기계 번역이 완전히 실용적일 수 있다. 3) 사용자 초상화의 정확성과 실시간 향상으로 정보 서비스 및 광고를 더욱 자연스럽고 우호적이며 개인화할 수 있습니다. 4) 채팅, 문답, 대화 기술 향상, 자연어 회화의 실용화 촉진 5) 대화 기술과 지식지도의 발전으로 지능형 고객 서비스와 인공 고객 서비스가 더욱 완벽하게 결합되어 고객 서비스 효율성을 크게 높였습니다. 6) 자연어 생성 기술의 발전으로 자동 시 쓰기, 작곡, 자동 뉴스 생성, 심지어 소설이 유행할 수 있다. 7) 인간-기계 대화의 진보는 음성 도우미, 사물인터넷, 스마트 하드웨어, 스마트 홈의 보급을 촉진한다. 8) 마지막으로 NLP+ 는 NLP 가 금융, 법률, 교육, 의료 등 수직 분야에서 널리 사용되고 있다는 것이다.

검색 엔진 인텔리전스를 예로 들어 보겠습니다. 이전의 검색 엔진, 키워드를 입력해서 물건을 한 무더기 돌려주니, 네가 직접 보러 가야 한다. (윌리엄 셰익스피어, 검색어, 검색어, 검색어, 검색어, 검색어) 자동질의 응답, 독해력 등의 능력이 향상됨에 따라, 현재의 검색 엔진은 질문을 할 수 있습니다. 문장은 조금도 두렵지 않습니다. 그것은 이 질문을 분석하고, 그 답을 연해 같은 문서에서 찾아낼 수 있습니다. 단순히 문서 링크를 주는 것이 아니라, 답을 직접 줄 수 있고, 검색 엔진의 결과도 점점 더 정확해지고 있다. (윌리엄 셰익스피어, 햄릿, 문서명언) < P > 뇌봉망: 향후 NLP 연구는 어떤 방향에 주목해야 하나요? < P > 주명: 저는 개인적으로 다음과 같은 점에 관심이 있습니다. 1) 사용자 초상화를 통해 개인화된 서비스를 제공합니다. 2) 설명 가능한 학습을 통해 인공 지능 메커니즘을 통찰한다. 3) 지식과 심화 학습의 결합을 통해 학습의 효율성을 높인다. 4) 마이그레이션 학습을 통해 도메인 적응을 달성합니다. 5) 학습을 강화함으로써 지속적인 진화를 달성한다. 6) 감독되지 않은 학습을 통해 표시안된 데이터를 최대한 활용하십시오. 7) 멀티미디어와 멀티 모달 간의 이해, 질문과 대답, 전환. < P > 3, 중국 NLP 연구는 세계 2 위 < P > 뇌봉망: 중국이 현재 NLP 분야에서 어떤 발전을 하고 있습니까? < P > 주명: 중국 NLP 의 발전에는 두 가지 측면이 있습니다. 하나는 과학연구 수준이고, 하나는 산업화입니다. NLP 산업화에서 중국은 검색 엔진, 전자 상거래, 뉴스 사이트, 기계 번역, 스마트 스피커와 같은 기술 시스템에서 NLP 가 핵심을 차지하고 있습니다. 중국 NLP 의 과학 연구 수준을 중점적으로 소개하겠습니다.

예를 들어 ACL 은 세계 자연어 처리 분야 최고 수준의 학술회의다. 약 2 년 전, 중국에는 ACL 문장 한 편이 없었다. 1998 년 칭화대 황창녕 교수 과제팀이 첫 ACL 문장 1 편을 발표했다. 당시 중국은 NLP 방향의 연구 기반이 약해 일본, 한국, 심지어 중국의 대만, 홍콩 지역도 중국 대륙이 ACL 에 발표한 것보다 훨씬 많은 문장. < P > 마이크로소프트중국연구원 (참고: 마이크로소프트아시아연구원으로 개명) 은 1998 년 11 월 출범한 이후 중국에서 NLP 의 발전을 크게 이끌었다. 역대 원장들은 모두 국제로 나아가라고 호소하며 연구원의 연구원들이 고교와 관련 학회와 협력하도록 독려했고, 모두 함께 중국의 연구 수준을 추진하기 위해 노력했다. 마이크로소프트연구원은 합동실험실, 여름학교, 인턴 프로그램을 통해 중국이 대량의 NLP 인재를 양성하도록 도왔다. < P > 동시에 CIPS, CCF 등 학회는 각종 강습반, 학술회의를 조직하고 국제 선진 이론과 기술을 도입하여 본토 NLP 의 향상을 크게 촉진시켰다. 문장 발표 방면에서 중국 NLP 인사도 ACL 에서의 영향력을 높이기 위해 부단히 노력하고 있다. 중국 정부는 NLP 분야에서 자연과학기금, 863, 973 등의 계획을 통해 투자와 지도를 강화했다. 각계의 노력을 통해 지난 2 년 안팎의 빠른 발전을 거쳐 중국은 이미 ACL 에서 2 위를 차지한 국가가 되었다. < P > 최근 5 년간 중국이 ACL 에 올린 문장 수 (장문과 단문 포함) 는 미국 다음으로 2 위를 기록했다. 장문의 경우 미국과의 거리는 약 2 ~ 3 편이다. 동시에 일본, 한국, 독일, 영국 등을 포함한 다른 모든 나라들을 훨씬 능가하는데, 원래 중국은 이 나라들의 등을 기대할 수 없었다. 만약 앞으로 중국 ACL 장문의 수가 계속 증가한다면, 3 년 안에 미국을 따라잡을 수 있을 것이다. 중국 NLP 발전세가 양호하기 때문에 기대할 수 있는 목표이다. < P > 만약 중국 의 문장 로 계산하면 214 년 중국 제 1 작가 의 문장 이 ACL 총 문장 수 의 36% 를 차지한 뒤 해마다 증가하고, 올해는 4% 로 중국 본토 사람 을 제외하고 많은 중국 유학생 이다. < P > 위의 수치로 볼 때 중국의 ACL 문장 (ACL) 은 확실히 세계 선두에 올랐다. 이것은 매우 놀라운 결과입니다. 2 년 전 중국에는 ACL 문장 한 편밖에 없었는데, 지금은 이미 세계 2 위에 안정적으로 자리잡았다. < P > 문장 수 외에도 중국 ACL 문장 품질도 크게 향상되었습니다. 예를 들어 217 년 ACL 의 22 편의 걸출한 논문 중 중국에서 온 문장 다섯 편이 등재되었다.

국제행사 참여로 중국도 점점 활발해지고 있다. 예를 들어 ACL 집행위원회에는 13 명의 집행위가 있는데, 그 중 3 명은 중국 출신이고, 중국 대륙에는 나와 바이두의 조세치가 있다. 저는 ACL 후선 주석 (참고: 219 년 취임 예정) 이고, 조세치는 사무총장이며, 대만 출신의 장경신은 수석 IT 책임자입니다. < P > 또한 중국의 총 스폰서 수와 스폰서 수도 미국에 가깝다. 참석자 수 면에서 우리도 2 위다.

NLP 분야 COLING 이나 EMNLP 와 같은 다른 중요한 회의도 비슷한 상황이다. < P > 그래서 중국은 부끄럽지 않은 NLP 제 2 강국이다.

CCF 는 여기에 많은 기여를 했습니다. CCF 중국어 정보기술 전문위원회는 NLPCC 와 같은 학술대회를 조직해 ADL 강의를 조직하고 여러 차례 고교 활동을 조직했다. NLPCC 대회에서는 학생 workshop 을 전문적으로 조직하여 연구와 논문 작성 방법을 강의했다. CCF 는 또한 CIPS 와 긴밀하게 협력하여 언어와 지능 정상회담을 차례로 주관한다. 이 정상회담은 NLP 분야의 발전을 효과적으로 촉진하고 사회에 미치는 영향력을 높인다.

물론 아직 개선해야 할 몇 가지 문제가 있습니다. 이는 1) 중국에서 열린 NLP 분야의 국제회의나 행사가 적다는 것을 보여준다. 2) 중국의 ACL 회원은 비교적 적다. 3) 국제NP 대회에서는 중국의 초청 보고서, 베스트 논문, SIG 주석, workshop 주석, tutorial 연사 등이 적다. 4) 중국에서 온 논문은 수량이 2 위이지만, 많은 문장 들이 다소 다른 사람의 취향을 따르고 있으며, 앞으로 중국에서 온 문장 들이 이끄는 추세를 더 잘 반영할 것으로 기대하고 있다. < P > 4, 중국 NLP 가 급부상한 이유 < P > 뇌봉망: 어떤 요인으로 우리나라 NLP 가 빠르게 발전하고 있습니까?

주명:? 첫째, 국가 전체가 상승하는 추세는 공업농업이든 국민경제든 종합 국력 등이다. 둘째, 우리는 국제와 접목하는 것이 점점 좋아지고 있다. 예를 들어 우리의 NLPCC 대회의 업무언어는 영어이고, 대회 의장, 절차위원회 의장, 각 분야 주석은 모두 두 명의 * * * * 주석을 설치하고, 한 명은 국내에서, 한 명은 외국에서 왔다. 셋째, 중국의 고교와 회사는 양성과 도입을 통해 많은 우수한 NLP 인재를 흡수했다. < P > 특히 외국 기업과 국내 인터넷 기업이 ACL 에 기여한 것을 언급해야 한다. 예를 들어, Microsoft Asian Institute 는 국내 및 아시아 지역의 많은 대학과 전방위적인 협력을 통해 여름 학교 공동 연구실에서 박사 과정 학생, 인턴 프로그램 등을 공동 양성하는 등 많은 NLP 인재를 양성했습니다. 예를 들어, 18 년 동안 Microsoft Institute 에서 양성한 NLP 분야의 인턴은 이미 45 명이 넘는다. 이 사람들은 전국 각지에서 왔으며, 마이크로소프트에서 인턴십을 한 후 각 고교로 돌아와 회사나 학교에 입사하여 리더쉽이 되고, 다음 세대의 인재의 성장을 이끌고, 이 분야의 발전을 계속 추진하고 있다. < P > 는 바이두, 알리, 텐센트, 징둥, 오늘의 헤드라인 등 대형 인터넷 회사와 많은 신예 회사 (예: 문문, 국쌍, 특이점, 송아지 번역, 스피치, 신화지운 등 많은 회사) 도 국내 NLP 발전에 큰 기여를 했다는 점을 지적해야 한다. CCF 를 대표하여 국내외 기업들이 NLP 분야의 발전과 발전에 기여한 것에 대해 매우 감사드립니다. < P > 뇌봉망: NLP 분야의 날, 한국 등은 중국보다 조금 일찍 발전했는데, 왜 지금 중국에 비해 많이 뒤떨어질까?

저우 밍: 몇 가지 요소가 있다고 생각합니다. 첫 번째 요인은 인터넷 시대 중국이 중국 인터넷의 발전과 기회를 잡았고, 많은 다른 나라들은 인터넷 (특히 모바일 인터넷, 전자 상거래, 검색 등) 에서 상대적으로 뒤떨어졌다는 점이다. 예를 들어, 많은 나라에는 자체 검색 엔진이 없고, 중국에는 바이두, 써우거우, 마이크로소프트 로컬라이제이션과 같은 많은 것들이 있습니다. 검색 엔진은 문제 이해, 문장 이해, 문답, 번역에 대한 수요가 관련 NLP 기술의 발전을 촉진시켰기 때문에 자연어에 대한 추진력이 매우 크다. 동시에, 그것의 거대한 경제적 가치는 또한 많은 사람들이 이 분야에 투자하여 연구를 하고 산업화를 하도록 끌어들였다. (윌리엄 셰익스피어, 윈스턴, 경제명언) 한 나라에 검색 엔진이 없으면 NLP 측은 자연히 뒤떨어질 것이다.

또 다른 요소는 데이터입니다. 중국은 세계에서 가장 큰 데이터, 8 억 명이 넘는 모바일 인터넷 사용자, 대량의 전자 상거래 데이터를 보유하고 있으며, 이러한 데이터는 연구와 기술의 발전에 도움이 될 것이다.

세 번째는 이와 관련하여 정부의 역할이다. 세계 경제 사슬에서 국가의 지위는 인터넷과 모바일 인터넷의 시대, 특히 현재의 인공지능 시대가 가진 지위로 이어질 수 있다. 중국은 현재 GDP 에서 두 번째로 큰 나라이기 때문에 서로