Закон Гудхарта в AI-бенчмарках

Новые бенчмарки, где модели пока проседают, быстро перестают быть показательными из-за закона Гудхарта: показанная метрика становится целью оптимизации. Публикация нового бенчмарка — это маркер вектора, который лаборатории будут атаковать. Через пару циклов разрыв между человеком и моделями сократится, как уже происходило с ARC-AGI v1 и v2.

Источник: Workshop transcript, 2026-04-17

Закон Гудхарта в AI-бенчмарках

Закон Гудхарта в AI-бенчмарках

Связанные заметки

Закон Кэмпбелла о сопротивлении метрикам

Атрибуты инструментов скрыты от модели

Парадокс измерения производительности при смене технологий

Tokenmaxxing: рост затрат токенов компенсирует падение их цены

Федерализм создаёт пятнистую карту AI-развития

AI Product Engineer

Исследуйте больше связей