Пример самокоррекции через фидбэк-лернинг

Когда агент Робин начал сокращать user ID в Telegram, команда дала фидбэк, что нужны полные ID для поиска. Робин оформил это как лернинг, человек его промоутил, и теперь агент всегда оставляет полные ID и добавляет ссылку на trace. Так формируется контекстно-специфичное поведение через цикл ошибка → фидбэк → закрепление.

Связи

Цикл Approve/Edit как механизм обучения AI-агента — Описывает ту же механику обучения агента через цикл обратной связи и человеческое одобрение.
AI Chief of Staff как член команды с институциональной памятью — Показывает, как подобные микро-обучения в итоге формируют полезную институциональную память агента Робина.
AI-агент как аналитик с доступом к production-данным — Раскрывает практическую ценность добавления ссылок на трейсы, чему агент научился в исходном примере.
Team OS как слой знаний с процессом актуализации — Концептуально связывает индивидуальный опыт обучения агента с общей системой управления знаниями команды.

Источник: Workshop transcript, 2026-06-12

Пример самокоррекции через фидбэк-лернинг

Пример самокоррекции через фидбэк-лернинг

Связи

Связанные заметки

Рефлексия AI как инструмент создания скиллов

Низкий барьер экспериментирования с LLM

Цикл Approve/Edit как механизм обучения AI-агента

Публичность AI-ассистента ускоряет обучение команды

Дискретный vs непрерывный подход в AI-ассистентах

AI Product Engineer

Исследуйте больше связей