Китайская компания Baidu, которой принадлежит одноимённый поисковик, уже несколько лет занимается разработкой собственного искусственного интеллекта. Исследования начались ещё в 2013 году, а теперь ИИ от Baidu демонстрирует очень неплохие результаты. Например, недавно он научился говорить без помощи человека. На днях компания представила систему преобразования текста в речь, которая называется Deep Voice.
Нейросеть использовала принципы глубокого обучения для анализа речи и сопоставления её с текстом, после чего начала вполне сносно произносить слова. Сначала Deep Voice раскладывает слово на отдельные звуки, затем вводит данные в систему синтеза речи и произносит нужное слово. Результаты пока далеки от совершенства, поэтому Baidu предстоит ещё много работы.
Несмотря на значительные успехи китайского поискового гиганта, компания Google продолжает лидировать в этой области. Её система WaveNet уже успешно синтезирует речь, опираясь на «прочитанный» ранее текст. Сейчас американская разработка умеет говорить на двух языках, и специалисты продолжают над ней работать. В данный момент Google нанимает новых сотрудников, планируя увеличить штат разработчиков в два раза.
Источник: hi-news