Агентная модель на основе LLM Voyager, действующая в майнкрафте
Under construction.
Сегодня (2024-02-01) просмотрел статью про агент Voyager (код). Идея относительно простая, но захотелось разобраться в деталях.
Модель Voyager на основе LLM GPT-3.5 и GPT-4. Исследует уровень в майнкрафте, с целью “как можно больше всего пооткрывать побыстрее” (территории и создающиеся предметы).
Есть три модуля.
- Планировщик (Automatic Curriculum)
- Итеративный промтер (Iterative Prompting Mechanism)
- “Словарь” навыков (Skill Library)
- Планировщик - на основе полученных от GPT-V описаний вида сцены (например, лес) и персонажа (json описывающий его инвентарь) генерирует Reasoning (рассуждение какое-то, приводящее к…) и Task.
- Task - задача, что нужно сделать. Далее это передаётся словарю навыков.
- Словарь навыков как-то формируется.
- Потом по запросу из него выбирается один из навыков, который является программой, и запускается.
- Комбинирование и появление навыков наименее понимаю. Используется feedback от среды, опять же в текстовом виде.
- Итеративный промтер как-то генерирует новые промты.
- Видимо, к предыдущему: мы видим ошибки от кода выполняемого, соответственно понимаем что пришло к успеху и что нет.
Картиночки в статье красивые, есть код :)
См. также:⌗
- BabyAGI
- ChaosGPT - что-то вроде BabyAGI, только с изначально деструктивными промтами (не одобряю, но задумка на текущем уровне - как высечь море, что-то такое).
Остальные записи