기금넷 공식사이트 - 재경 문답 - 인공지능은 좋은가요, 나쁜가요?
인공지능은 좋은가요, 나쁜가요?
업계에서 우리 모두가 알고 있듯이 얼굴인식은 인공지능 분야에서 가장 성숙하고 오래된 분야 중 하나로 LFW, MegaFace, 마이크로소프트가 제안한 MS 등 수많은 국제대회에 참가해왔다. 작년 - Celeb-1M 벤치마크 테스트는 매년 얼굴인식의 '월드컵'으로 알려져 있다. 최근 '월드컵'이 끝났는데, 이는 '중국과 미국이 AI 발전에 보조를 맞추고 있다'는 일종의 확인에 가깝다. 오리온스타라는 중국 인공지능 기업이 우승을 차지한 셈이다. 중요한 경쟁 프로젝트에서 가장 먼저 승리하세요.
경쟁의 권위적 성격을 고려하면, 인공지능이 폭풍처럼 공공생활에 파고들기 전, 많은 외부인의 눈에는 위의 결과가 다소 의외였다. 컴퓨터 비전 분야 최고의 컨퍼런스인 ICCV2017 플랫폼의 도움으로 이번 대회에는 대규모 얼굴 인식 대회(HardSet 및 RandomSet)가 포함될 뿐만 아니라 보다 도전적인 소규모 대회를 혁신적으로 출시한다는 점을 언급할 가치가 있습니다. 샘플 학습(Low-Shot Learning) 대회는 최근 업계에서 가장 가치 있는 유사 대회라고 할 수 있습니다. 이는 자연스럽게 전 세계 얼굴 인식 팀의 "금상 획득"에 대한 강한 열망을 불러일으킵니다. 결과는 만족스럽습니다. 1년 미만의 Orion Starry Sky가 우승했습니다. 이번 대회에서는 제한된 카테고리(대회에서 제공한 데이터만 사용)의 하위 제안이 1위로 식별되었습니다.
실제로 지난주에도 이 스타트업이 여러 번 화제를 모았습니다. 7월 26일, 오랫동안 소문이 자자했던 샤오미 AI 스피커가 공식 출시되었습니다. 후자는 온라인 콘텐츠 제공이라는 표면적 적용 뒤에는 의심할 여지 없이 샤오미의 "스마트 홈 허브" 역할을 맡습니다. 전체 생태학적 제품 체인을 "연결"하려는 Xiaomi의 핵심 레이아웃입니다. 치타모바일의 인공지능 자회사인 오리온스타는 샤오미 AI 스피커의 중요한 파트너로, '지구상에서 가장 부드러운 목소리'로 사용자에게 답장할 수 있는 음성 상호작용 시스템을 제공하고 있다.
타임라인을 한 달 전으로 되돌려 오리온스타 AI 생태체인의 첫 번째 제품으로 히말라야도 AI 스피커 '샤오야'를 출시했다. 그 핵심 기술 역시 오리온이다. Xingkong Full Link가 자체 개발한 원거리 음성 상호작용 시스템 - AI 스피커의 '트렌드'에 발을 들여놓은 회사들이 있지만, 음성 상호작용의 가장 중요한 장판을 찾고 있다면 Orion Xingkong이 그들의 것입니다. 가장 믿을 수 있는 이식 파트너.
안면인식 '월드컵' 우승과 음성 시스템을 함께 고려한다면 이 스타트업의 빠른 추진력을 찾는 것은 어렵지 않다. 적어도 현 단계에서는 인공지능이 음성인식, 이미지 인식, 언어이해, 로봇공학 등의 응용기술로 크게 나눌 수 있다는 점을 알아야 한다. 그 중 음성인식과 이미지 인식은 현재 비교적 성숙된 분야로 일반적으로 정확도가 높다. 90%를 넘는 비율 - 이는 지속적인 개선이 어렵다는 의미이기도 하다. 오리온스타는 인공지능 부문에서 단기간에 이미 두 번의 높은 고도를 달성할 수 있는데, 이는 스타트업 중에서는 극히 드물다.
얼마 전 뉴욕타임스는 미국 정부 관료와 실리콘밸리 엘리트들을 대거 인터뷰한 뒤 다음과 같이 결론을 내렸다. 인공지능을 낳는다. 이 중국 스타트업의 '월드컵' 승리가 중-미 AI 경쟁이라는 거대한 맥락에 놓이게 된다면 이 기업에 대한 면밀한 분석은 큰 의미가 있다.
뛰어난 기술
먼저 마이크로소프트의 경쟁사부터 살펴보자.
앞서 언급한 대로 오리온스타는 이번 공모전의 하위 제안 식별 제한 부문(공모전에서 제공한 데이터만 활용)에서 1위를 차지했다. 이름에서 알 수 있듯이 데이터와 경쟁하려는 경향이 더 많은 비제한 카테고리(외부 데이터의 사용이 무제한이므로 훈련 모델의 데이터가 많을수록 당연히 더 좋음)에 비해 제한된 카테고리는 제한된 데이터 내에서만 호출할 수 있습니다. 제한된 데이터 조건에서 최고의 정확도를 달성하는 것은 매우 어렵고 훨씬 더 어렵기 때문에 상대적으로 순수한 알고리즘 경쟁입니다. 물론 이러한 제한 때문에 제한된 알고리즘 간의 경쟁이 상대적으로 공정합니다.
공정성은 높은 기준점을 의미하기도 합니다.
경쟁 데이터는 시끄러워서 훈련에 직접 사용할 수 없으며, 전체 훈련 데이터 세트도 매우 방대하며 대규모 얼굴 모델 훈련에 적합한 모델은 리소스 요구 사항이 높으며 빠르고 효율적으로 달성하기 어렵습니다. 그래서 논의 끝에 Orion Sky 팀은 다양한 수준의 다양한 유형의 노이즈 데이터를 효과적으로 제거할 수 있는 강력한 노이즈 제거 알고리즘을 설계하는 동시에 대규모 교육에 적합한 삼중항 모델을 사용하기로 결정했습니다. 제한된 자원 하에서 삼중 신경망의 학습을 가속화하고 성능을 크게 향상시켜 최종적으로 0.75/0.606(randomset/hardset)이라는 높은 점수를 달성했습니다. 이는 이전 기록을 훨씬 뛰어넘고 외부 데이터를 사용하지 않는 한계에 거의 도달한 결과입니다. .
사실 설립된 지 오래되지 않았지만 팀원들의 과거 기술 축적(공식 소개:오리온스타의 창업팀에는 실리콘밸리 등 세계적인 기술 기업 출신의 전문가들이 있다) , 일본, 대만, 베이징 및 심천) 기술 엘리트(그 중 거의 50%가 박사 학위 보유)는 창립 이래 얼굴 인식 분야 탐구에 전념할 수 있도록 해왔습니다. 이들은 '월드컵'에 참가하기 전 또 다른 국제 안면인식 대회인 LFW에서도 톱3를 달성한 바 있다. LFW에서는 '월드컵' 우승의 논리와 유사하게 정확성만을 추구하는 팀들과 달리 오리온은 최대한 작은 네트워크를 사용하여 최대한의 정확성을 추구하려 했고, 이로 인해 다른 많은 팀들이 눈썹을 올리십시오.
치타모바일의 탄탄한 제품 사고력을 바탕으로 '기술 과시'에 집착하는 많은 스타트업 팀들과 달리 오리온스타는 한 가지 사실을 알고 있다. 기술을 제품으로 바꾸는 것은 언제나 기술 성숙도의 시험대였다는 것이다. . 유일한 표준입니다. 따라서 위에서 언급한 오리온스타의 경쟁기술은 모두 학술발표나 공모전에만 국한되지 않고 출입통제, 로봇, 모바일 APP 등 특정 제품에 적용될 예정이다. 예를 들어, 현재 매일 20만 시간 이상의 라이브 콘텐츠를 생성하는 치타의 라이브 방송 제품인 Live.me에 얼굴 인식 기술이 사용되고 있으며, 24시간 실시간 모니터링이 가능해 리뷰 효율성이 크게 향상됩니다. 불법 콘텐츠.
사람을 친절하게 대하게 만드는 스피커
기술 구현에 있어서 오리온스타의 인공지능 스피커는 “사람처럼 소통”할 수 있다는 것이 더 좋은 예일 수 있다.
실제로 음성 상호 작용과 관련하여 Orion Star는 이제 마이크 배열, 음성 깨우기, 음성 인식, 의미 이해 및 음성 합성 등 원거리 음성 기술 전체를 마스터하고 각 링크를 보완합니다. 서로 협력하여 상호 작용 경험을 크게 향상시킵니다. 예를 들어, 가장 중요한 음성 깨우기를 예로 들면, 오리온 별이 빛나는 하늘에 있는 한자의 전반적인 모델링을 기반으로 하는 CNN 깨우기 기술로, 음성 상호 작용 시스템은 고정밀 깨우기를 달성할 수 있으며, 업계 최고의 오경보 수준, 인식 시 인간 음성 반응의 간섭 문제 해결 ——현재 오리온 스카이의 각성률은 95% 이상인 것으로 알려졌습니다.
또 다른 예로 지난달 출시된 샤오야(Xiaoya)는 인간의 목소리에 진정으로 반응할 수 있는 업계 최초의 스피커다. Orion Star는 빅데이터 감성 음성 합성 기술과 중국어 음성 합성 기술을 도입하여 중국어 음성 합성의 자연스러움을 향상시키고 뚜렷한 악센트 레벨을 갖게 하여 Xiaoya라는 이름의 옆집 소녀와 정말 흡사합니다. 이런 사운드의 기술적 진보는 전형적인 사용자의 생각(엔지니어의 생각이 아님)이기 때문에 샤오야 스피커는 출시되자마자 시장의 호평을 받았으며, 사전 판매 5만 대가 모두 매진됐다.
한 달 뒤 오리온스타는 이 사용자의 생각을 샤오미 AI 스피커 '샤오아이 클래스메이트'로 옮겼다. Xiaoya와 유사하게 Orion Star가 제공하는 인간 음성 응답 기술을 사용하면 "Xiao Ai"가 잠에서 깨어났을 때 "안녕하세요", "나 여기 있어요" 및 기타 응답으로 응답할 수 있으며 Orion Star가 제공하는 또 다른 핵심 기술은 음성 합성입니다. Xiaomi AI 스피커에는 "지구상에서 가장 부드러운 여성 목소리"가 부여됩니다. 이 기술을 통해 모든 AI 스피커는 친근하고 부드러운 사운드 곡선으로 모든 사용자의 요구에 응답할 수 있습니다.
이러한 기술을 통해 사용자는 기계를 진심으로 대하게 될 것으로 예상됩니다(블라인드 테스트 결과, 유사 제품과 비교했을 때 사용자의 70%가 오리온 스타 기술이 만들어내는 음성을 매우 좋아함). 로봇"은 가족의 일원이 되는 피할 수 없는 길을 촉진하는 역할을 합니다.
경험이 왕이다
스피커라고 하면 현재 중국 스마트 스피커 시장은 거의 무질서할 정도로 혼란스럽다.
얼마 전 히말라야 부사장 리하이보가 심천 난산구를 돌아다니다 1㎞ 이내에 음성지능 제품을 만드는 기업이 112곳이 있다는 사실을 발견하고 그 중 4곳을 방문했다고 한다. : 다들 모듈과 솔루션을 연구하고 있는데, 콘센트가 아주 가까운 줄은 알지만 항상 같은 자리에 갇혀 있는 사용자가 거의 없습니다.
사실 신기술의 등장은 늘 사람들을 행복하게 하지만, 신기술이 조기에 사라질 것인지, 빨리 대중화될 것인지를 결정하는 한 가지가 있는데 바로 바로 사용자 경험이다.
위에서도 언급했듯이 단순히 근육을 휘두르는 인공지능 기업과 달리 오리온스타의 가장 큰 장점은 인터넷적 사고를 갖춘 AI 기업이라는 점에 있다. 제품 경험을 중시하는 엔지니어 집단과 기술을 존중하는 제품 관리자 집단으로 구성돼 있어 대부분의 음성·얼굴인식 기업과 차별화되기 충분하다.
예를 들어 Fu Sheng은 세부 사항을 언급한 적이 있습니다. Orion Star는 히말라야의 콘텐츠와 음악 라이브러리는 물론 다양한 파트너의 음악 라이브러리를 통합했을 뿐만 아니라 서버 측 세부 사항도 최적화했습니다. 웹사이트에 게시된 제목, 오디오, 가사, 프로그램 최적화 등의 모든 내용은 히말라야 고유의 라벨로 인쇄되어 콘텐츠를 더욱 구어체로 만들고 사용자 경험을 극대화합니다.
글쎄, 다양한 기술 엘리트들의 머릿속에 흩어져 있는 수요 개념에 비해, AI를 가능한 한 빨리 좋은 경험을 갖춘 제품으로 바꾸는 것은 의심할 여지 없이 더 중요하며, 오리온 스타는 의심할 여지 없이 이를 잘 알고 있습니다.
사실 인공지능은 그해의 전력 혁명과 많은 유사점을 가지고 있습니다. 예를 들어, 인공지능은 그 자체로 '산업'이 아닙니다. AI의 기회는 단순히 응용 프로그램과 결합하는 데 있습니다. 둘째, 일반 사람들은 에디슨과 테슬라 사이의 DC/AC 분쟁에 관심이 없습니다. Fu Sheng이 말했듯이 "딥 러닝"은 데이터 기반입니다. 모델 매개변수가 있고 고유한 장점이 있지만 다른 회사에서는 장점을 신속하게 균등화할 수 있는 더 많은 데이터와 매개변수가 있습니다. 기술적인 결과물을 제공함으로써 성공할 수 있다는 생각도 듭니다. 미래에는 딥러닝이 기본적인 기술 응용이고 많은 기업이 딥러닝 연구개발 역량을 갖추고 있다고 생각합니다.”
그래서 기술 자체인가. 또는 기술을 구현하는 사용자 경험에서 오늘날의 오리온 스카이는 "나이를 믿을 수 없는 성숙함"을 입증했으며, 두 가지의 조합은 의심할 여지 없이 그들의 미래를 기대하게 합니다.
Li Beichen/Text(대화 자료와 통찰력을 제공하기 위해 우아한 기사를 사용하는 데 전념하는 잘 알려진 기술 셀프 미디어)
- 관련 기사
- 긴급긴급긴급~~영화 '새엄마 사랑해요' 보신 아이들 오세요~~
- 제프 장(Jeff Chang)의 노래 'A Little Bit of Tempting'을 각색한 영화가 개봉을 앞두고 있습니다. 이 영화에 대해 어떻게 생각하시나요?
- 선리의 할리퀸 이미지가 갑자기 인기를 끌었습니다. 선리는 여전히 활력이 넘치는 이유는 무엇일까요?
- 소망과 소망의 차이
- htc xv6875와 xv6975 중 어느 것이 더 낫나요?
- Liu Qian 포커 마술 교육
- 궈이판(Guo Yifan)과 덩닝(Deng Ning) 중 누가 더 노래를 잘하나요?
- 얼굴이 붉어지고 여드름이 나기 쉬운 경우 어떻게 해야 하나요?
- 타임마크가 돋보이는 맥덜의 울려퍼지는 가사~! ! ! 긴급한! ! !
- 1992 년, 메이옌팡 노래방에서 맞았는데, 마지막 타자의 결말은 어떻게 되었나요?