Антигаллюцинации: как сделать ответы ИИ точными и безопасными (протокол «не знаю», self-check, уверенность)

Самая опасная ошибка при работе с ИИ — не “вода” и не “кривая структура”. Самая опасная — уверенная неправда. Когда ответ звучит убедительно, но факты там придуманы. И беда в том, что на глаз это не всегда видно — особенно в маркетинговых и информационных текстах, где модель легко добавляет “красивые цифры”, “типовые кейсы” и “как будто реальные” ссылки.

Gemini_Generated_Image_u98oduu98oduu98o

Антигаллюцинации: как сделать ответы ИИ точными и безопасными (протокол «не знаю», self-check, уверенность)

Промты-Инструкции

0:27 1:14

Уровень статьи

★★★★
✓ Подойдёт, если:

вы уже умеете писать структурные промты, но хотите исключить «уверенную неправду»: снизить выдумки, научить ИИ честно говорить «не знаю», маркировать допущения и аккуратно работать с фактами.

🎯 После статьи вы сможете:

использовать протокол «Факты / Предположения / Неизвестно / Что спросить дальше», включать self-check перед выдачей ответа и настраивать «честный режим» — без придуманных цифр, кейсов и ссылок.

✗ Что здесь НЕ будет:

продакшен-инженерии: подключение базы знаний (RAG), вызов инструментов/API, мониторинг и A/B-тесты, PromptOps-процессы и полноценный набор метрик качества.

Важно: цель промпта — не “красивый ответ”, а повторяемый результат. Поэтому в каждой статье мы фиксируем: роль, задачу, контекст, ограничения и формат вывода. Эти принципы одинаково работают в любом направлении.

Эта статья — про практику: как заставить ИИ работать в честном режиме, маркировать допущения и проверять себя перед выдачей результата.

Что такое “галлюцинации” на практике (и почему это не всегда очевидно)

Под “галлюцинациями” обычно понимают “ИИ придумал факт”. Но в реальности они бывают разными:

  • Факты из воздуха: придуманные даты, цифры, названия, условия.
  • Подмена смысла: вы просили “без обещаний”, а он всё равно обещает, только мягко.
  • Фальшивые ссылки: выглядит как ссылка на источник, но это просто текст.
  • Уверенный тон без оснований: формулировки “точно”, “гарантированно”, “всегда” там, где данных нет.

Чем более “деловым” выглядит ответ, тем легче его принять на веру. Поэтому нужен протокол.

Почему ИИ галлюцинирует

Есть несколько причин, которые повторяются постоянно:

  • Мало данных — модель стремится заполнить пробелы.
  • Слишком широкая задача — модель выбирает “типовой” путь.
  • Смешали инструкции и исходники — модель подхватила мусор.
  • Нет правила “не знаю” — модель предпочитает “додумать”, а не остановиться.
  • Вы сами попросили “убедительно” — и она начала убеждать любыми средствами.

Это не “поломка”. Это поведение по умолчанию. Наша задача — поменять режим.


Главный принцип: отделяй факты от предположений

Отделяйте факты от предположений. Это один из самых надёжных способов снизить выдумки и получить результат, который не стыдно публиковать.

Правило звучит так: факты — отдельно, предположения — отдельно. Если модель что-то додумала “по умолчанию”, это должно быть явно помечено, а не спрятано в тексте как будто это истина.

Универсальный формат, который почти всегда спасает ситуацию, состоит из четырёх частей. Факты — это только то, что вы дали во входных данных. Предположения — то, что модель добавляет как типовой вариант, когда информации не хватает. Неизвестно — вещи, которые нельзя утверждать без дополнительных данных. И наконец что спросить дальше — 1–3 уточняющих вопроса, которые закрывают главные пробелы.

Если вы готовите материал к публикации, такой формат часто работает лучше любого запроса “будь точным”, потому что он заставляет модель показывать границу между данными и догадками.


Протокол «Не знаю»: как говорить честно и полезно

“Не знаю” — это не отказ. Это нормальная точка контроля.

Хороший протокол выглядит так:

  • Скажи, чего не хватает (одной строкой)
  • Предложи 2–3 варианта (если можно)
  • Задай 1–3 вопроса (критических)
  • Предложи план проверки (если нужны источники)
Пример: “В тексте нет данных о сроках и цене, поэтому я не буду их указывать. Уточните: срок разработки (1–2 / 2–4 / 4–8 недель) и есть ли фиксированная стоимость. Если не знаете — сделаю версию без цифр.”

Self-check: проверка ответа перед выдачей

Self-check — это не “внутренние рассуждения”. Это просто контроль по чек-листу перед финальным ответом.

Мини-чек-лист:

  • Я ответил на задачу, а не на “что-то рядом”?
  • Я соблюл формат вывода?

Я не добавил фактов, которых не было во входных данных?

  • Я не нарушил запреты (штампы, обещания, юридические риски)?
  • Если чего-то не хватает — я спросил или пометил допущение?

Self-check становится обязательным

Когда в тексте появляются цифры, цены или сроки. Любая конкретика такого типа без проверки — прямой путь к “уверенным данным из воздуха”.

Также self-check нужен, если вы даёте обещания результата. Даже мягкие формулировки могут незаметно превратиться в гарантию, а это уже риск.

Отдельный случай — публикация от имени компании. Здесь цена ошибки выше: текст воспринимают как официальную позицию, и “неточность” легко становится репутационной проблемой.

Self-check обязателен, когда вы добавляете ссылки или источники. Если источник не был дан, модель может “сгенерировать” его видимость — это нужно отсекать на входе.

И наконец, self-check нужен при любых юридически чувствительных формулировках: ответственность, условия, гарантии, возвраты, соответствие требованиям и любые заявления, которые могут быть истолкованы как обязательство.


Источники и ссылки: правило “не придумывай”

Простая установка, которую лучше прописывать в промте:

  • Если источник не дан — не выдумывай ссылку.
  • Если нужны подтверждения — спроси: “дать ссылку или оставить без источника?”
  • Если источников нет, формулируй нейтрально: “обычно”, “как правило”, “часто” — без категоричности.

И отдельное правило для кейсов:

“Если кейсы не предоставлены — не придумывай кейсы. Предложи шаблон кейса или вопросы для сбора данных.”