Новый алгоритм, созданный специалистами лаборатории OpenAI, основанной главой SpaceX и Tesla, существенно облегчает процесс обучения роботов. Если раньше для того, чтобы запрограммировать робота, нужно было писать к нему специальные алгоритмы, сейчас всё выглядит гораздо проще — роботу просто нужно показать, что необходимо сделать, а робот спустя какое-то время научится повторять необходимую последовательность действий и сможет обходиться без помощи человека.
Имитационное обучение — новая веха в работе лаборатории. Сейчас специалисты обкатывают разработку на роботе-манипуляторе, который довольно быстро научился складывать пирамидки из кубиков, посмотрев с помощью зрительной нейросети, как это делает один из разработчиков.
Разработка основана на предыдущих программах лаборатории, но в отличие от предыдущих программ создатели алгоритма применяли не настоящие фотографии и предметы, решив на этот раз использовать гарнитуру виртуальной реальности и программу, в которой воссоздали стол, освещение и кубики с разными текстурами. Подсветку, цвета кубиков и стола, а также элементы окружения постоянно меняли, но робот отлично справлялся с задачей, раз за разом повторяя действия оператора.
Создатели алгоритма хотят его доработать, чтобы ИИ мог решать больше разных задач в совершенно непохожих условиях. Новый метод обучения похож на игру с ребёнком, который тоже сначала не всегда справляется, но потом совершенствует навыки и начинает выполнять определённые задачи лучше и лучше.