Пример самокоррекции через фидбэк-лернинг
Пример самокоррекции через фидбэк-лернинг
Когда агент Робин начал сокращать user ID в Telegram, команда дала фидбэк, что нужны полные ID для поиска. Робин оформил это как лернинг, человек его промоутил, и теперь агент всегда оставляет полные ID и добавляет ссылку на trace. Так формируется контекстно-специфичное поведение через цикл ошибка → фидбэк → закрепление.
Связи
- Цикл Approve/Edit как механизм обучения AI-агента — Описывает ту же механику обучения агента через цикл обратной связи и человеческое одобрение.
- AI Chief of Staff как член команды с институциональной памятью — Показывает, как подобные микро-обучения в итоге формируют полезную институциональную память агента Робина.
- AI-агент как аналитик с доступом к production-данным — Раскрывает практическую ценность добавления ссылок на трейсы, чему агент научился в исходном примере.
- Team OS как слой знаний с процессом актуализации — Концептуально связывает индивидуальный опыт обучения агента с общей системой управления знаниями команды.
Источник: Workshop transcript, 2026-06-12
Связанные заметки
Рефлексия AI как инструмент создания скиллов
#ai#workflow#reflection
Низкий барьер экспериментирования с LLM
#ai#llm#experiments
Цикл Approve/Edit как механизм обучения AI-агента
#ai#learning#feedback-loops
Публичность AI-ассистента ускоряет обучение команды
#ai#augmentation#learning
Дискретный vs непрерывный подход в AI-ассистентах
#ai#workflow#feedback
Хотите глубже изучить ai и автоматизация?
AI Product Engineer
Постройте своего AI коллегу. 5 сессий, старт 2 мая
Узнать о курсеИсследуйте больше связей
Эта заметка — часть сети из 2,400+ взаимосвязанных идей. Откройте для себя неожиданные связи в интерактивном графе знаний.
Открыть граф знаний