Jump to content
RA.BY
Sign in to follow this  
Алёна Вайпер

ОК запустили сервис распознавания аудиосообщений

Recommended Posts

image.png.5d98181174af1f5f4b96815740ecdfbe.png

 

В социальной сети «Одноклассники» появилась функция перевода аудиосообщений в текст. Сервис распознавания аудио автоматически конвертирует голосовое сообщение в текст, позволяя без прослушивания понять, о чем говорит собеседник. Сервис работает на базе искусственного интеллекта и реализован на основе технологии, разработанной «ВКонтакте». Запуск стал очередным важным шагом в интеграции ОК и экосистемы VK.

 

Новый сервис сделает общение в ОК более комфортным в ситуациях, когда прослушать голосовое сообщение невозможно: в общественном транспорте, во время совещания с коллегами или во время просмотра фильма. Технология распознает как полученные, так и отправленные голосовые сообщения на русском языке длительностью до 60 минут. Благодаря этому текст аудиосообщений индексируется поиском по сообщениям, что позволяет легко найти в чате любую информацию, даже отправленную голосом. При ответе на распознанное голосовое сообщение в чате будет отображаться текст исходного сообщения, а не аудио, что поможет ориентироваться в переписке с собеседником. Для распознанных сообщений в списке чатов также отображается текст, а не значок аудиосообщения.

 

Конвертация голосовых сообщений в текст в ОК полностью автоматизирована: пользователь сразу получает расшифровку без дополнительных действий. ОК также добавили возможность скопировать текст распознанного аудиосообщения. Функцию можно использовать для работы с текстами, которые наговорит собеседник, или конвертации собственных голосовых заметок в текст для дальнейшей работы с ним.

 

Технология распознавания речи «ВКонтакте» основана на трех нейросетях: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания и заглавные буквы. Для обучения нейросетей используются аудио, которые специально для этой задачи записывают участники программы VK Testers, и база субтитров из фильмов. На конвертацию аудио в текст уходит всего около секунды. Нейросеть распознает русскоязычную речь, при этом в расшифровке учитываются разговорные слова, заимствованная лексика, а также сложные условия записи — например, низкое качество звука или нечеткая речь собеседника.

 

Распознавание аудиосообщений автоматически включено у всех пользователей последних версий мобильных приложениях ОК на Android и iOS, а также в десктопной версии соцсети. Отключить новую функцию можно в настройках профиля в разделе «Сообщения».

 

ОК постоянно запускают новые форматы для общения и обмена личным контентом. Ранее ОК дали возможность создавать собственные стикеры и мемы с помощью специального конструктора, что поможет пользователям подбирать актуальные для беседы или ситуации изображения даже без навыков владения фоторедакторами.

Share this post


Link to post
Share on other sites
ПОТРАЧЕНО

Так у кого круче - у VK или ОК?

В смысле, распознование речи у кого реализовано лучше?

Share this post


Link to post
Share on other sites
9 минут назад, ser89 сказал:

Так у кого круче - у VK или ОК?

В смысле, распознование речи у кого реализовано лучше?

Думаю система одна )

  • Upvote 1

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this  

×
×
  • Create New...