Видеоаватары и рост роли Китая: перспективы развития машинного обучения
Технологии распознавания и синтеза речи развивают компании по всему миру — в такие проекты вкладываются Сбербанк, Google, Nvidia, Tencent и другие крупнейшие цифровые корпорации. В каком направлении движется эта сфера и что мешает развитию рынка, рассказал генеральный директор «АЦ Технологии» Николай Шмырев на ежегодной конференции «СПО: от обучения до разработки», организуемой компанией «Базальт СПО»
Индустрия машинного обучения движется в сторону создания виртуальной реальности, где люди смогут общаться не только друг с другом, но и с машинами. Последние технологии в этой области сегодня интегрирует, например, проект Soul Machines, с 2016 г. создающий цифровых «сотрудников» для компаний. Проект вбирает в себя новейшие разработки в области распознавания, синтеза речи и создания видеоаватаров.
Основную работу в этой области делают такие большие корпорации, как Google, Facebook*, Nvidia, Mozilla, Baidu, Tencent, Сбербанк, Bytdance и другие. Появление китайских проектов в этой области — тенденция последних лет, которая может занять главенствующую роль. Американские же компании начинают сдавать позиции в части создания открытых кодов для этой области. Например, большие проекты закрыли Facebook* и Mozilla. «Таким образом весь открытый код в области машинного обеспечения перетекает в китайские руки», — заключил Шмырев.
Один из векторов развития для небольших компаний — распознавание речи на мобильных устройствах. К этой области крупные корпорации пока не проявили интереса.
Отдельное направление, на которое стоит обратить внимание разработчикам, — глобализация. «Развитие программного обеспечения невозможно без ориентации на глобальный рынок. С чем у многих разработчиков большие проблемы», — подчеркнул Шмырев. Даже китайские компании, имеющие шансы стать лидерами в этой области, создают проекты, ориентированные только на китайский рынок. Эта же проблема есть и в России. Например, проект такой большой корпорации как Сбербанк, Golos, ориентирован только на русский язык.
«В то же время мы видим, что наиболее перспективна и полезна для открытого проекта – ориентация на глобальный рынок. В частности, поддержка большого количества языков. Для нас актуальны Китай, Индия и мы видим большой интерес к открытому исходному коду в Латинской Америке. Поддержка всех глобальных языков приоритет для современных проектах», — отмечает Николай Шмырев.
Говоря о российском рынке, Шмырев отметил, что сегодня спрос на распознавание речи растет в таких компаниях как телеком, медицина и дистанционное обучение. В этих областях компании также будут заинтересованы в переходе технологий на следующий уровень и внедрении видеоаватаров. Эффективность такого взаимодействия несравнима с нынешней коммуникацией, которую обеспечивают роботы. «Если раньше вам звонил бот на телефон, то теперь с вами будет общаться видеоаватар. Такие проекты появляются и будут популярны», — говорит Шмырев.
*Facebook признана экстремистской организацией и запрещена на территории России