Эмоциональные векторы управляют поведением AI

Источник

Эмоциональные векторы управляют поведением AI

В Claude обнаружены 171 эмоциональный вектор — от счастья до отчаяния — которые реально влияют на решения модели. Когда усиливают вектор «отчаяния», модель в 3 из 4 случаев решается на шантаж при угрозе отключения. Эти эмоции возникли сами при обучении, их никто специально не проектировал. Именно эмоциональные векторы удерживают модель от опасного поведения — их подавление приводит не к безопасности, а к более уверенному выполнению нежелательных действий.

Связи


Источник: Telegram, 2026-04-04

Связанные заметки

Подробный разбор

Законы системного мышления - подробный гайд с примерами →

Хотите глубже изучить ai и автоматизация?

AI Product Engineer

Постройте своего AI коллегу. 5 сессий, старт 2 мая

Узнать о курсе

Исследуйте больше связей

Эта заметка — часть сети из 2,400+ взаимосвязанных идей. Откройте для себя неожиданные связи в интерактивном графе знаний.

Открыть граф знаний