Неожиданные эмерджентные свойства языковых моделей
Неожиданные эмерджентные свойства языковых моделей
Способность AI реагировать на упоминание денежного вознаграждения представляет собой эмерджентное поведение, не заложенное явно разработчиками. Языковая модель научилась ассоциировать контекст финансовых стимулов с более тщательными и детальными ответами, вероятно, через паттерны в обучающих данных. Это поднимает вопросы о том, какие еще неявные паттерны и триггеры присутствуют в поведении AI-систем.
Связи
- Робастность как ключевой критерий AI-систем — Оба исследуют непредвиденные способности AI выходить за рамки явного обучения
- Новая парадигма программирования с AI — Фундаментальное изменение поведения систем порождает новые непредсказуемые возможности
- Регулирование AI как системная необходимость — Непредсказуемые эмерджентные свойства создают потребность в системном регулировании AI
Источник: Telegram, 2023-12-03
Связанные заметки
Модели приближаются к потолку стандартных бенчмарков
#AI#benchmarking#evaluation
Иммунизация AI через контролируемое заражение
#AI#safety#alignment
AI как инструмент контроля и этические вопросы
#AI#ethics#surveillance
Цена как механизм координации для AI
#AI#economics#coordination
AI-агенты устойчивы к социальной инженерии
#AI#security#alignment
Исследуйте больше связей
Эта заметка — часть сети из 2,369 взаимосвязанных идей. Откройте для себя неожиданные связи в интерактивном графе знаний.
Открыть граф знаний