Нейросеть google научилась читать по губам лучше человека (2 фото)
Команда исследователей из подразделения Google DeepMind и Оксфордского университета совместно создали программу WLAS, которая благодаря неестественному интеллекту поискового гиганта обучилась просматривать по губам лучше человека. По окончании просмотра более пяти тысяч часов записей телевизионных передач BBC обученная методу распознавания мимики нейросеть начала осознавать 46.8% слов. Как заявляют разработчики, у опытного чтеца по губам показатель образовывает 12.4%.
Ранее ученые из Оксфорда поведали о собственной программе LipNet, просматривающей по губам с точностью до 93.4%, тогда как люди с соответствующими навыками показывали итог 52.3%. Вот лишь в том случае обучение проводилось на базе маленькой базы видео и 51 неповторимым словом. При с WLAS за 5000 часов дикторами BBC (в записи, конечно же) было сказано порядка 110 000 предложений с применением 17 500 неповторимых слов.
Авторы проекта уверены в том, что чтение по губам дополнит работу методов распознавания речи, к примеру, в то время, когда ведется запись в шумном окружении. Помимо этого, WLAS сможет оказать помощь людям с нарушениями слуха общаться с другими людьми и понимать суть происходящего на телеэкране (на протяжении просмотра передач, фильмов, шоу).
Еще одна область применения — научить голосовых ассистентов, наподобие Siri, осознавать пользователя, не слыша его обращение, лишь считывая данные с губ. Конечно же, очень странные люди упрекнут разработчиков в попытке установить тотальную слежку за населением и всем, что они не только делают, но и говорят.
Источник: theverge.com