Публикация

Разбирает базу как работают AI agent loops, harness и evals

Бывший инженер Google выпустил короткий 20-минутный о том, как устроена «внутрянка» современных ИИ-агентов. Если вы планируете собирать что-то сложнее простого чат-бота, этот стек обязателен к пониманию.

Логика работы фреймворка: • Agent Loops + Memory: основа системы. Цикл, в котором агент планирует действие, выполняет его и запоминает результат для следующего шага. • Трассировка и Harness: каждый запуск агента фиксируется. Это позволяет видеть, на каком этапе «сломалась» логика. • Evals (LLM-оценщики): прогон логов через другую нейросеть-судью, которая ищет ошибки в рассуждениях. • Итерация: находите сбой → фиксите промпт или архитектуру → выкатываете обновление.

Именно за счет такой связки (Loop + Harness + Eval) агенты постепенно обучаются и перестают галлюцинировать в сложных сценариях.

Смотреть разбор на YouTube Схема фреймворка в X (Twitter)

Комментарии