06 октября 2020 19:25

ИИ вместо сжатия: Nvidia анонсировала революцию в видеозвонках

Компания Nvidia объявила о запуске платформы для разработчиков Maxine, которая исправляет главные недостатки, связанные с видеозвонками

Компания Nvidia объявила о запуске платформы для разработчиков Maxine, которая исправляет главные недостатки, связанные с видеозвонками. Привлекая технологии искусственного интеллекта, новый сервис повышает качество картинки, устраняет фоновые шумы и убеждается, чтобы собеседник всегда был в кадре.

ИИ-алгоритмы Maxine способны даже слегка повернуть голову, создав впечатление, будто пользователь смотрит прямо в камеру, или заменить её на виртуальный аватар. Также система умеет распознавать речь, переводить с иностранного языка и создавать субтитры в режиме реального времени.

Другая важная особенность платформы Nvidia — послабление требования к качеству соединения. Передавая только "ключевые точки лица", технология снижает требование к пропускной способности "до одной десятой" в сравнении с видео, сжатого кодеком H.264.

Как отмечает The Verge, сжатие видео, мгновенный перевод и некоторые другие возможности Maxine не новы и уже реализованы в других сервисах. Например, функция, направляющая взгляд в камеру, имеется в Microsoft Surface Pro X и Apple FaceTime. Тем не менее, технология Nvidia на демонстрационном ролике выглядит очень впечатляюще.

Что важно, Maxine — это не очередной видеосервис для пользователей, а набор инструментов для сторонних компаний. Конкретный функционал будет зависеть от того, как их реализуют разработчики в своих приложениях. Пока что в Nvidia объявили об одном партнерстве — с коммуникационной фирмой Avaya.