Цикл оптимизации через накопление данных

Источник

Цикл оптимизации через накопление данных

Высокие переменные издержки reasoning моделей могут быть временным явлением. Накопив миллиарды примеров chain-of-thought рассуждений, провайдеры смогут использовать эти данные для нового раунда pre-training. Это позволит снова перевести накопленные знания в постоянные издержки, восстановив эффект масштаба на новом уровне качества.

Связи


Источник: Telegram, 2025-01-11

Связанные заметки

Исследуйте больше связей

Эта заметка — часть сети из 2,369 взаимосвязанных идей. Откройте для себя неожиданные связи в интерактивном графе знаний.

Открыть граф знаний