ОК запустили сервис распознавания аудиосообщений

Алёна Вайпер · September 25, 2021

image.png.5d98181174af1f5f4b96815740ecdfbe.png

В социальной сети «Одноклассники» появилась функция перевода аудиосообщений в текст. Сервис распознавания аудио автоматически конвертирует голосовое сообщение в текст, позволяя без прослушивания понять, о чем говорит собеседник. Сервис работает на базе искусственного интеллекта и реализован на основе технологии, разработанной «ВКонтакте». Запуск стал очередным важным шагом в интеграции ОК и экосистемы VK.

Новый сервис сделает общение в ОК более комфортным в ситуациях, когда прослушать голосовое сообщение невозможно: в общественном транспорте, во время совещания с коллегами или во время просмотра фильма. Технология распознает как полученные, так и отправленные голосовые сообщения на русском языке длительностью до 60 минут. Благодаря этому текст аудиосообщений индексируется поиском по сообщениям, что позволяет легко найти в чате любую информацию, даже отправленную голосом. При ответе на распознанное голосовое сообщение в чате будет отображаться текст исходного сообщения, а не аудио, что поможет ориентироваться в переписке с собеседником. Для распознанных сообщений в списке чатов также отображается текст, а не значок аудиосообщения.

Конвертация голосовых сообщений в текст в ОК полностью автоматизирована: пользователь сразу получает расшифровку без дополнительных действий. ОК также добавили возможность скопировать текст распознанного аудиосообщения. Функцию можно использовать для работы с текстами, которые наговорит собеседник, или конвертации собственных голосовых заметок в текст для дальнейшей работы с ним.

Технология распознавания речи «ВКонтакте» основана на трех нейросетях: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания и заглавные буквы. Для обучения нейросетей используются аудио, которые специально для этой задачи записывают участники программы VK Testers, и база субтитров из фильмов. На конвертацию аудио в текст уходит всего около секунды. Нейросеть распознает русскоязычную речь, при этом в расшифровке учитываются разговорные слова, заимствованная лексика, а также сложные условия записи — например, низкое качество звука или нечеткая речь собеседника.

Распознавание аудиосообщений автоматически включено у всех пользователей последних версий мобильных приложениях ОК на Android и iOS, а также в десктопной версии соцсети. Отключить новую функцию можно в настройках профиля в разделе «Сообщения».

ОК постоянно запускают новые форматы для общения и обмена личным контентом. Ранее ОК дали возможность создавать собственные стикеры и мемы с помощью специального конструктора, что поможет пользователям подбирать актуальные для беседы или ситуации изображения даже без навыков владения фоторедакторами.

scala · September 29, 2021

Развитие идет с опозданием )

ser89 · September 29, 2021

Так у кого круче - у VK или ОК?

В смысле, распознование речи у кого реализовано лучше?

scala · September 29, 2021

9 минут назад, ser89 сказал:

Так у кого круче - у VK или ОК?

В смысле, распознование речи у кого реализовано лучше?

Думаю система одна )

Sign In

ОК запустили сервис распознавания аудиосообщений

Recommended Posts

Алёна Вайпер

Link to comment

Share on other sites

scala

Link to comment

Share on other sites

ser89

Link to comment

Share on other sites

scala

Link to comment

Share on other sites

ALL ABOUT WEB PROMOTION