Jump to content
RA.BY

ОК запустили сервис распознавания аудиосообщений


Алёна Вайпер

Recommended Posts

image.png.5d98181174af1f5f4b96815740ecdfbe.png

 

В социальной сети «Одноклассники» появилась функция перевода аудиосообщений в текст. Сервис распознавания аудио автоматически конвертирует голосовое сообщение в текст, позволяя без прослушивания понять, о чем говорит собеседник. Сервис работает на базе искусственного интеллекта и реализован на основе технологии, разработанной «ВКонтакте». Запуск стал очередным важным шагом в интеграции ОК и экосистемы VK.

 

Новый сервис сделает общение в ОК более комфортным в ситуациях, когда прослушать голосовое сообщение невозможно: в общественном транспорте, во время совещания с коллегами или во время просмотра фильма. Технология распознает как полученные, так и отправленные голосовые сообщения на русском языке длительностью до 60 минут. Благодаря этому текст аудиосообщений индексируется поиском по сообщениям, что позволяет легко найти в чате любую информацию, даже отправленную голосом. При ответе на распознанное голосовое сообщение в чате будет отображаться текст исходного сообщения, а не аудио, что поможет ориентироваться в переписке с собеседником. Для распознанных сообщений в списке чатов также отображается текст, а не значок аудиосообщения.

 

Конвертация голосовых сообщений в текст в ОК полностью автоматизирована: пользователь сразу получает расшифровку без дополнительных действий. ОК также добавили возможность скопировать текст распознанного аудиосообщения. Функцию можно использовать для работы с текстами, которые наговорит собеседник, или конвертации собственных голосовых заметок в текст для дальнейшей работы с ним.

 

Технология распознавания речи «ВКонтакте» основана на трех нейросетях: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания и заглавные буквы. Для обучения нейросетей используются аудио, которые специально для этой задачи записывают участники программы VK Testers, и база субтитров из фильмов. На конвертацию аудио в текст уходит всего около секунды. Нейросеть распознает русскоязычную речь, при этом в расшифровке учитываются разговорные слова, заимствованная лексика, а также сложные условия записи — например, низкое качество звука или нечеткая речь собеседника.

 

Распознавание аудиосообщений автоматически включено у всех пользователей последних версий мобильных приложениях ОК на Android и iOS, а также в десктопной версии соцсети. Отключить новую функцию можно в настройках профиля в разделе «Сообщения».

 

ОК постоянно запускают новые форматы для общения и обмена личным контентом. Ранее ОК дали возможность создавать собственные стикеры и мемы с помощью специального конструктора, что поможет пользователям подбирать актуальные для беседы или ситуации изображения даже без навыков владения фоторедакторами.

Link to comment
Share on other sites

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...