Under construction.

Сегодня (2024-02-01) просмотрел статью про агент Voyager (код). Идея относительно простая, но захотелось разобраться в деталях.

Модель Voyager на основе LLM GPT-3.5 и GPT-4. Исследует уровень в майнкрафте, с целью “как можно больше всего пооткрывать побыстрее” (территории и создающиеся предметы).

Есть три модуля.

  1. Планировщик (Automatic Curriculum)
  2. Итеративный промтер (Iterative Prompting Mechanism)
  3. “Словарь” навыков (Skill Library)
  • Планировщик - на основе полученных от GPT-V описаний вида сцены (например, лес) и персонажа (json описывающий его инвентарь) генерирует Reasoning (рассуждение какое-то, приводящее к…) и Task.
    • Task - задача, что нужно сделать. Далее это передаётся словарю навыков.
  • Словарь навыков как-то формируется.
    • Потом по запросу из него выбирается один из навыков, который является программой, и запускается.
    • Комбинирование и появление навыков наименее понимаю. Используется feedback от среды, опять же в текстовом виде.
  • Итеративный промтер как-то генерирует новые промты.
    • Видимо, к предыдущему: мы видим ошибки от кода выполняемого, соответственно понимаем что пришло к успеху и что нет.

Картиночки в статье красивые, есть код :)

См. также:

  • BabyAGI
  • ChaosGPT - что-то вроде BabyAGI, только с изначально деструктивными промтами (не одобряю, но задумка на текущем уровне - как высечь море, что-то такое).