Разработчики Baidu Research представили прототип искусственного интеллекта, который умеет переводить речь в режиме реального времени.
ИИ получил название STACL («синхронный перевод с ожиданием и контролируемой задержкой»). По словам Лиан Хуанг, ведущего ученого лаборатории ИИ Baidu в Кремниевой долине, отличительная черта разработки заключается в том, что при переводе система пытается предугадывать слова – это позволяет минимизировать задержки между фразой и переводом.
Разработчики отмечают, что принцип работы STACL идентичен технике, которую используют люди.
«Переводить речь в реальном времени – работа не из легких. Переводчикам нужно одновременно слушать, мысленно переводить и говорить на другом языке, отставая не более чем на несколько слов. Именно вследствие высокой умственной нагрузки синхронисты, как правило, работают в командах, заменяя друг друга через каждые 10-30 минут», – заметил Хуанг.
И хотя кажется, что с задачами, требующими параллельной обработки, компьютеры должны справляться как нельзя лучше, все существующие на сегодняшний день искусственные «толмачи» переводят последовательно, то есть ожидают окончания предложения и только затем выдают перевод. Несмотря на то, что их работа достаточно точна, ее скорости недостаточно, чтобы переводить речь в режиме реального времени.
STACL, по словам разработчика, предугадывает слова весьма качественно, но не без ошибок. Чтобы повысить точность работы искусственного интеллекта, разработчики рекомендуют его предварительно натренировать на требуемой тематике.
«Как и в случае человека, машине нужно предварительно изучить тему перевода – например, «почитать» медицинскую литературу перед конференцией на тему медицины», — говорит Хуанг.
Для удобства, задержки перевода для отставания от исходной фразы можно регулировать. По умолчанию они составляют 3–5 слов.
Сейчас STACL может синхронно переводить речь в текст. В дальнейшем разработчики намерены научить его озвучивать перевод.
В Baidu отмечают, что STACL предназначен исключительно для частного использования и не призван заменить живых переводчиков, которые работают, например, на встречах в ООН, где требуется предельно ясный перевод.