GDPval как открытый инструмент оценки AI в профессиях

GDPval как открытый инструмент оценки AI в профессиях

Бенчмарк GDPval, созданный OpenAI и адаптированный Anthropic, содержит реалистичные профессиональные задачи в открытом доступе на Hugging Face. Для каждой профессии задачи формулируются максимально приближенно к реальности — например, для sales-менеджера это подготовка отчёта по продажам клиента и плана на следующий период. Это позволяет объективно сравнивать производительность AI и экспертов-людей.


Источник: Workshop transcript, 2026-05-20

Связанные заметки

Хотите глубже изучить ai и автоматизация?

AI Product Engineer

Постройте своего AI коллегу. 5 сессий, старт 2 мая

Узнать о курсе

Исследуйте больше связей

Эта заметка — часть сети из 2,400+ взаимосвязанных идей. Откройте для себя неожиданные связи в интерактивном графе знаний.

Открыть граф знаний