Методология оценки возможностей AI через O*NET и GDPval

Методология оценки возможностей AI через O*NET и GDPval

Anthropic использует двухуровневую методологию для оценки AI-возможностей. Теоретические способности измеряются через бенчмарк GDPval на базе O*NET (базы типичных задач профессий), где эксперты с 15+ летним опытом сравнивают результаты AI и людей на реальных задачах. Практическое применение оценивается через десятки тысяч интервью и анализ логов использования AI-инструментов.


Источник: Workshop transcript, 2026-05-20

Связанные заметки

Подробный разбор

Time to Insight - подробный гайд с примерами →

Хотите глубже изучить ai и автоматизация?

AI Product Engineer

Постройте своего AI коллегу. 5 сессий, старт 2 мая

Узнать о курсе

Исследуйте больше связей

Эта заметка — часть сети из 2,400+ взаимосвязанных идей. Откройте для себя неожиданные связи в интерактивном графе знаний.

Открыть граф знаний