Инженеры из Бостонского университета научили роботов готовить идеальные хот-доги. Можно было бы предположить, что учёным стоит заниматься чем-то более серьёзным. Однако в ходе нынешней работы они проводили важное исследование: тестировали программную платформу, которая поможет специалистам в будущем обучать роботов выполнению куда более сложных задач быстрее.
В статье, опубликованной в журнале Science Robotics, сотрудники инженерного колледжа Бостонского университета, работающие во главе с профессором Кэлином Белтой (Calin Belta), описывают процесс обучения двух роботов – Джейко (Jaco) и Бакстера (Baxter) – приготовлению и подаче хот-догов.
Технология обучения сочетает в себе методы машинного обучения и так называемые формальные методы.
Последние представляют собой группу техник, которые обычно используются для обеспечения безопасности в авионике или в обеспечении кибербезопасности. Проблема в том, что эти разрозненные техники обучения трудно объединить математически и преподнести роботу понятным ему "языком".
Профессор Белта и его команда использовали направление машинного обучения, известное как обучение с подкреплением.
В этом случае, хотя шаги выполнения главной задачи прописаны в алгоритме заранее, "инструкции" о том, как именно делать эти шаги, у машины нет. В итоге, когда робот начинает лучше справляться с заданием, он получает особый "одобрительный" отклик системы, своего рода вознаграждение, что "мотивирует" его постепенно найти идеальный способ выполнения задачи. Например, того, как наилучшим образом положить сосиску на булочку.
Группа Белта, добавив формальные методы, создала программную платформу, которая поможет сократить количество попыток, которые должен произвести робот, чтобы научиться выполнять ту или иную задачу, которую поставил перед ним человек.
Добавим, что одна из важных проблем робототехники сегодня: исследователи до сих пор не до конца понимают, как именно обучаются алгоритмы машинного обучения. Так как искусственный интеллект "мыслит" не так как человек, то и разобраться в его логике людям не так просто (добавим к этому огромный объём обрабатываемой машинами информации).
Это "ограничение" не позволяет применить метод к сложным задачам, таким как автономное вождение. Ведь в некоторых ситуациях, когда очень рискованное решение принимает машина, а не человек, необходимо полностью понимать то, как автономные системы обучаются строить выводы о правильности своих решений.
Наблюдение за тем, как обучаются своим новым навыкам Джейко и Бакстер, поможет инженерам создавать ещё более "умных" и безопасных роботов.
Профессор рассматривает эту работу как демонстрацию эффективности их программной платформы и надеется, что в дальнейшем она будет применена и к другим сложным задачам, таким как улучшение систем автономного вождения.
Ранее авторы проекта "Вести.Наука" (nauka.vesti.ru) рассказывали о том, как роботы Google учатся друг у друга, а также о том, как, обучая робота, дети могут улучшить свои навыки письма.