Начал проходить курс “AI Safety fundamentals”, и там есть видео Андрея Карпатого про LLM. Больше половины инфы оттуда я знал, но:

  • идея про то, что языковые модели как класс программ ведут себя аналогично операционным системам (LLM OS). Подробности по ссылке (видео на английском).
  • там очень классное описание возможных атак на LLM (промт-инъекций и не только), со ссылками на статьи. Понятно, что это всё прикрывается достаточно быстро.

Пара (ныне недоступных) быстрых моделей

  • Groq (ixbt) - ASIC (специализированная микросхема) для быстрого инференса LLM. Потыкать можно тут, (там Llama, Mistral, есть платное АПИ), это впечатляет скоростью. В какой-то момент без прокси перестало быть доступным.
  • https://fastsdxl.ai - это быстрая генерация картинок, со скоростью ввода. Скорость достигнута в т.ч. благодаря использованию маленькой модели SD XL Lightning. Сейчас недоступна, обещают вернуться.