Boston Dynamics, автор сверхпопулярных видео про пляшущих и прыгающих роботов, показала мир глазами этих самых роботов. И рассказала, в какой степени машины управляются оператором, а в какой принимают решение самостоятельно.
Так вот, в пространстве Atlas ориентируется как беспилотный автомобиль — с помощью камер и лазерного дальномера. Но для сканирования пространства непосредственно перед роботом используется камера time-of-flight. Похожие стоят в смартфонах в качестве сенсора глубины сцены для портретной съемки, а здесь это часть системы восприятия.
Именно на основе ее данных нейросети планируют движения машины на несколько шагов вперед. На видео они обозначены зелеными следами. Тут суть в том, что оператор предоставляет роботу примерную карту местности и относительно общее задание. То есть, например, "забравшись на ящик нужно сделать сальто назад" – это команда. А вот найти этот ящик, понять как забраться, как прыгнуть и на что приземляться – это уже собственные решения робота, основанные на данных системы восприятия (которые обновляются 15 раз в секунду) и на предыдущем опыте.
Отсюда обилие падений и прочих ошибок – каждое новое препятствие — это импровизация на основе данных из базы знаний. Каждое успешное действие – новая запись в этой базе. Собственно, и паркур выбран не случайно – это бесконечный набор сложностей для обучения машины. Ну и эффектные видео, конечно.