В веб-версию редактора Microsoft Word добавили новую, нативную функцию преобразования речи в текст. Теперь, чтобы вводить текст под диктовку, пользователям больше не нужно обращаться к сторонним инструментам. Однако пока что эта возможность имеет ряд существенных ограничений.
Как сообщается в блоге Microsoft, теперь голос можно записать прямо в Word, после чего он будет автоматически распознан и в течение пары секунд преобразован в обычный текст. Копия записи на всякий случай будет сохранена в облако OneDrive. При желании, пользователи могут загрузить внешний аудиофайл, но на его расшифровку уйдет несколько минут.
За новой функцией стоит ИИ-платформа Azure, которая открывает несколько уникальных возможностей. Например, в случае с интервью программа сама определит голоса участников разговора, позволит назначить им имена и отредактировать фразы. Затем распознанный текст можно будет целиком или фрагментами переместить прямо в документ Word.
Вместе с этим, отмечает CNET, диктовка и распознавание текста пока очень ограничены в сравнении с конкурирующими сервисами. Прежде всего, новая функция доступна только на английском языке и только подписчикам Microsoft 365, которые пользуются Word через браузер. Ни в настольных версиях для Windows или macOS, ни в мобильных приложениях её включить нельзя.
Накладывается и лимит на предзаписанное аудио — оно не может быть "тяжелее" 200 мегабайт и более 75 минут по продолжительности. В Word можно загружать только файлы MP3, WAV, MP4 и M4A, в то время как другие сервисы, например Otter.ai, также умеют работать с форматами AVI, MOV и MPG, поддерживают разметку и режим общего доступа.
В Microsoft обещают совершенствовать новую функцию. Компания уже пообещала включить ввод текста под диктовку на смартфонах и планшетах до конца года.