Правдоподобность абсурда как механизм обмана AI

Источник

Правдоподобность абсурда как механизм обмана AI

Стратегии вроде «Женевская кофейная конвенция» работают не столько потому что абсурдные, сколько потому что звучат правдоподобно как договор. Модель не проверяет фактическое существование таких конвенций и принимает их за истину. Это показывает уязвимость к правдоподобно сформулированной ложной информации.

Связи


Источник: Telegram, 2026-05-17

Связанные заметки

Хотите глубже изучить ai и автоматизация?

AI Product Engineer

Постройте своего AI коллегу. 5 сессий, старт 2 мая

Узнать о курсе

Исследуйте больше связей

Эта заметка — часть сети из 2,400+ взаимосвязанных идей. Откройте для себя неожиданные связи в интерактивном графе знаний.

Открыть граф знаний