Качество данных важнее их количества при обучении моделей
Качество данных важнее их количества при обучении моделей
Среднестатистический автор в интернете дает среднестатистические ответы при обучении модели. Для получения экспертных результатов нужно тренировать на качественных данных и делать RLHF с экспертами, а не аутсорсерами. Это объясняет, почему меньшие модели, обученные на отобранных данных (как Llama 3), могут превосходить более крупные модели общего назначения.
Связи
- 20190402_0392 Контекст как защита от аналитических ошибок — Экспертный контекст критичен: там — для анализа, здесь — для обучения моделей
- 20230310_1517 Окружение определяет возможности роста — Качество окружения определяет результат: эксперты для RLHF vs аутсорсеры — как среда для роста
Источник: Telegram, 2024-05-13
Связанные заметки
Data moats переоценены в эру AI
#AI#data#competitive-advantage
Симуляции как решение проблемы данных для роботов
#AI#robotics#simulation
Управление личностью AI через векторы
#AI#tools#personalization
Систематизация экспертизы через AI-инструменты
#AI#knowledge-management#scaling
Интерактивные бизнес-симуляции как формат обучения
#learning#gamification#AI
Исследуйте больше связей
Эта заметка — часть сети из 2,369 взаимосвязанных идей. Откройте для себя неожиданные связи в интерактивном графе знаний.
Открыть граф знаний