Документ, описывающий MineDojo, универсальный агент искусственного интеллекта Nvidia, который может выполнять действия из письменных подсказок в Minecraft, получил награду за выдающиеся наборы данных и контрольные показатели на конференции NeurIPS (системы обработки нейронной информации) 2022 года, как сообщила Nvidia в понедельник.

Арс Техника сообщает: Чтобы обучить фреймворк MineDojo играть в Minecraft, исследователи предоставили ему 730 000 видеороликов Minecraft на YouTube (с более чем 2,2 миллиарда слов расшифровано), 7 000 скопированных веб-страниц из вики Minecraft, а также 340 000 сообщений Reddit и 6,6 миллиона комментариев Reddit, описывающих игровой процесс Minecraft.

На основе этих данных исследователи создали специальную модель трансформера под названием MineCLIP, которая связывает видеоклипы с определенными игровыми действиями Minecraft.

В результате кто-то может сказать агенту MineDojo, что делать в игре, используя естественный язык высокого уровня, например, «найти пустынную пирамиду» или «построить портал в Нижний мир и войти в него», и MineDojo выполнит серию шагов, необходимо, чтобы это произошло в игре.

MineDojo стремится создать гибкого агента, который может обобщать изученные действия и применять их к различным действиям в игре.

Как пишет Nvidia: «Хотя исследователи уже давно обучают автономных агентов ИИ в средах видеоигр, таких как StarCraft, Dota и Go, эти агенты обычно являются специалистами лишь в нескольких задачах.

Поэтому исследователи Nvidia обратились к Minecraft, миру» (TM).

Это самая популярная игра, направленная на разработку масштабируемой системы обучения агента широкого профиля, «того, который может успешно выполнять широкий спектр открытых задач».

Отмеченная наградами статья была опубликована в июне.

Вы можете увидеть примеры MineDojo в действии на его официальный сайт, и код для MineDojo и MineCLIP, доступен на GitHub.