Ученые из Монреальского института изучения алгоритмов (MILA) в Канаде представили технологию синтеза речи нового поколения, которая способна почти в точности скопировать голос человека. Прослушав всего минуту его речи, компьютер сможет воспроизвести целые слова и фразы, едва отличимые от оригинала.
Читайте также: Искусственный интеллект Google совершил прорыв в синтезе речи
Задействуя вычислительные кластеры на GPU-ускорителях, алгоритмы могут генерировать свыше тысячи предложений менее чем за полсекунды. Технология пока что далека от идеала, однако любой человек, услышав искусственный голос, сможет сразу догадаться, кто произносит речь.
Читайте также: Intel открыла синтезатор речи Стивена Хокинга для всех желающих
Канадские исследователи признают, что их разработка может быть использована злоумышленниками, чтобы ввести в заблуждение дипломатов и СМИ, а также способствовать появлению новостей-фальшивок. Кроме того, Lyrebird может быть задействована мошенниками для кражи личности. В связи с этим, отмечает PCMag, алгоритмы были выложены в открытый доступ — так, чтобы любой человек был осведомлен о том, что аудиозапись более не является надежным источником доказательств.
Источник: PCMag