AI приближается к экспертному уровню в знаниевой работе

Источник

AI приближается к экспертному уровню в знаниевой работе

Claude Opus 4.1 показал лучшие результаты среди моделей, приближаясь к уровню экспертов-людей. Основная слабость всех моделей — следование инструкциям, а не точность или знания. GPT-5 проигрывал в основном из-за форматирования и эстетики ответов, но имел меньше проблем с instruction-following. Важно: люди могли распознать AI по стилистическим маркерам (например, em-dash), что создавало потенциальный bias в оценке.

Связи


Источник: Telegram, 2025-09-25

Связанные заметки

Исследуйте больше связей

Эта заметка — часть сети из 2,369 взаимосвязанных идей. Откройте для себя неожиданные связи в интерактивном графе знаний.

Открыть граф знаний