Компания Nvidia объявила о запуске платформы для разработчиков Maxine, которая исправляет главные недостатки, связанные с видеозвонками. Привлекая технологии искусственного интеллекта, новый сервис повышает качество картинки, устраняет фоновые шумы и убеждается, чтобы собеседник всегда был в кадре.
ИИ-алгоритмы Maxine способны даже слегка повернуть голову, создав впечатление, будто пользователь смотрит прямо в камеру, или заменить её на виртуальный аватар. Также система умеет распознавать речь, переводить с иностранного языка и создавать субтитры в режиме реального времени.
Другая важная особенность платформы Nvidia — послабление требования к качеству соединения. Передавая только "ключевые точки лица", технология снижает требование к пропускной способности "до одной десятой" в сравнении с видео, сжатого кодеком H.264.
Как отмечает The Verge, сжатие видео, мгновенный перевод и некоторые другие возможности Maxine не новы и уже реализованы в других сервисах. Например, функция, направляющая взгляд в камеру, имеется в Microsoft Surface Pro X и Apple FaceTime. Тем не менее, технология Nvidia на демонстрационном ролике выглядит очень впечатляюще.
Что важно, Maxine — это не очередной видеосервис для пользователей, а набор инструментов для сторонних компаний. Конкретный функционал будет зависеть от того, как их реализуют разработчики в своих приложениях. Пока что в Nvidia объявили об одном партнерстве — с коммуникационной фирмой Avaya.