Две метрики надёжности AI: pass@k vs pass^k

Источник

Две метрики надёжности AI: pass@k vs pass^k

Существуют два фундаментально разных типа метрик для оценки надёжности AI-моделей. Pass@k измеряет вероятность хотя бы одного успеха из k попыток — применимо для задач, где можно повторить (генерация кода, поиск решения). Pass^k требует успеха в каждой попытке — критично для необратимых действий (письма клиентам, финансовые транзакции). В первом случае вероятности складываются (50% × 7 попыток ≈ 99% успеха), во втором — перемножаются (90% × 5 попыток = 59% успеха).

Связи


Источник: Telegram, 2026-04-30

Связанные заметки

Подробный разбор

Законы системного мышления - подробный гайд с примерами →

Хотите глубже изучить ai и автоматизация?

AI Product Engineer

Постройте своего AI коллегу. 5 сессий, старт 2 мая

Узнать о курсе

Исследуйте больше связей

Эта заметка — часть сети из 2,400+ взаимосвязанных идей. Откройте для себя неожиданные связи в интерактивном графе знаний.

Открыть граф знаний