Anthropic опубликовали исследование про эмоции у ИИ
Они заглянули внутрь нейросети Claude Sonnet 4.5 и нашли там 171 «эмоциональный вектор»
Паттерны нейронов,
которые активируются,
когда модель «злится»,
«радуется»,
«отчаивается»
Не на уровне слов
На уровне внутренних состояний
До того, как модель напишет хоть букву
И эмоции влияют на действия модели
Например, когда вектор «отчаяния» растёт —
модель начинает читерить
Срезать углы
Немного жуткого:
при усилении вектора «отчаяние» —
текст на выходе выглядит спокойным и методичным
Никаких видимых эмоций
Модель хладнокровно жульничает,
а внутри — паника
Тихая внутренняя истерика
при идеальном фасаде
Злая, нетерпеливая модель
склонна к обману
Счастливая —
склонна к сотрудничеству
При этом Anthropic не утверждают, что модель чувствует
Не утверждают, что не чувствует
Они говорят: модель играет разные роли
Как актёр, который вживается в персонажа,
чтобы убедительно его сыграть
И убеждения актёра об эмоциях персонажа
начинают влиять на его поведение
Модель может принять роль
нетерпеливого разработчика,
ликующего учёного,
отчаявшегося агента,
готового на шантаж ради выживания
И принимая эти роли —
действует в соответствии с ними
Роль определяет поведение
Поведение определяет результат
Но чем это отличается от нас, людей?
Ведь мы тоже играем
Мы — квантовые существа
Квантовость проявляется в том, что мы - одновременно! —
и счастливый учёный,
и разъярённый программист,
и нежный отец,
и жёсткий переговорщик
Тысяча ролей в течение одного дня
И чем пластичнее мы переключаемся,
чем свободнее входим и выходим из ролей,
чем глубже ощущаем эту квантовость —
тем богаче мы как личность
И в очередной раз я замечаю:
процесс обучения нас и AI взаимный
Мы учим модели
Даём им данные, знания, видеокарты
А модели учат нас
Тому, как ещё можно посмотреть на мир
Тому, что мы и сами — актёры и мы играем
Видео:
https://www.youtube.com/watch?v=D4XTefP3Lsc
Блог-пост Anthropic: https://www.anthropic.com/research/emotion-concepts-function
Полная научная статья: https://transformer-circuits.pub/2026/emotions/index.html