Это страница из глоссария “Термины ИИ простыми словами”. Здесь собраны базовые понятия искусственного интеллекта, которые встречаются чаще всего: от “что такое ИИ и модель” до “почему все говорят про LLM”.

Если вы новичок, этот словарь поможет быстро разобраться в терминологии и не теряться в обсуждениях внедрения ИИ. Формат простой: что это, зачем бизнесу, пример и типичная ошибка. Без лекций, но по делу.
Мини-карта: 3 типовые задачи ИИ
ИИ — это общее название для технологий, которые выполняют “умные” задачи: понимают текст, распознают изображения, дают рекомендации, генерируют ответы. Важно: ИИ — это не один инструмент, а целый класс решений с разной логикой и разной ценой внедрения. На практике “ИИ” почти всегда означает связку из данных, модели и сценария использования. Поэтому один и тот же “ИИ” может быть и простым классификатором, и полноценным ассистентом в чате.
Машинное обучение — это подход, когда система учится на примерах из данных, а не по правилам, прописанным вручную. ML хорошо подходит для задач, где условий слишком много и “табличные правила” быстро превращаются в хаос. Качество результата в ML обычно определяется качеством данных и тем, насколько чётко сформулирована цель. Если цель туманная, модель может выглядеть “умной” на отчёте, но проваливаться на реальных кейсах.
Глубокое обучение — это часть машинного обучения, где используются нейросети с большим числом слоёв. Этот подход особенно силён в задачах с текстом, изображениями, видео и аудио, где “простыми правилами” качество не вытащить. Обычно DL даёт лучший результат, но требует больше данных, ресурсов и времени на настройку. Проще говоря: он мощнее, но чаще дороже в обучении и эксплуатации.
Модель — это обученная система, которая превращает входные данные в результат: текст, число, категорию или изображение. Важно понимать: модель — это “двигатель”, но не весь продукт целиком. В реальном решении вокруг модели всегда есть интерфейс, интеграции, проверки, права доступа и логирование. Поэтому “поставить модель” ещё не значит “автоматизировать процесс” — обычно самое сложное начинается дальше.
Алгоритм — это последовательность действий, которая приводит к результату. В ИИ алгоритмы есть не только “внутри модели”, но и вокруг неё: поиск, ранжирование, фильтрация, проверки, маршрутизация. Иногда проект выигрывает не потому, что “самая умная нейросеть”, а потому что правильно построена логика процесса. И наоборот: сильная модель без нормального алгоритма вокруг может работать нестабильно и давать хаос на выходе.
Датасет — это набор данных, на которых модель учится и затем проверяется. Хороший датасет — это не “просто много строк”, а данные понятного качества и структуры, без мусора и противоречий. Если в данных хаос, модель выучит хаос и будет ошибаться закономерно, а не “случайно”. На практике качество датасета часто важнее, чем выбор “самой модной модели”.
Обучение — это процесс, когда модель на примерах подбирает внутренние параметры так, чтобы лучше решать задачу. Это не кнопка “сделай умным”, а управляемый этап: нужна цель, данные и проверка качества. Обучение может занимать время и ресурсы, а результат легко “сломать”, если данные плохие или постановка задачи кривая. В бизнесе обучение имеет смысл только тогда, когда вы измеряете эффект и понимаете, что именно улучшаете.
Инференс — это работа модели “в бою”, когда она уже обучена и выдаёт ответы или прогнозы. Именно инференс происходит каждый день: в чатах, обработке заявок, классификации документов. Поэтому инференс задаёт требования к скорости, стабильности и бюджету — если он медленный или дорогой, продукт будет раздражать пользователей. Даже при хорошем качестве модели проект может “не полететь”, если инференс не выдерживает нагрузку.
Параметры — это числа, в которых хранится то, чему модель научилась. Обычно чем больше параметров, тем выше потенциальное качество, но тем выше требования к ресурсам и стоимость эксплуатации. При этом “больше” не всегда значит “лучше именно для вас”: иногда решает сценарий, данные и ограничения. В бизнесе параметры — это про баланс: качество, скорость, бюджет и риски.
Архитектура — это то, как устроена модель внутри: из каких блоков она состоит и как они связаны. Разные архитектуры лучше подходят для разных задач: текст, изображения, прогнозы — это разные миры. Архитектура влияет на качество, скорость, требования к данным и стоимости. Если выбрать архитектуру “по хайпу”, можно получить дорогую систему, которая не даёт преимущества на вашем сценарии.
Нейросеть — это тип модели, который учится находить закономерности в данных. Слово “нейро” — метафора: это не мозг и не сознание, а математика. Нейросети полезны там, где слишком много вариантов и правил, и руками описывать всё дорого и долго. Но нейросеть не исправит плохие данные и плохую цель — она просто масштабирует проблему.
Слой — это шаг обработки внутри нейросети: данные проходят через слои и постепенно преобразуются. Чем больше слоёв, тем больше возможностей выучить сложные зависимости, но тем выше требования к данным и вычислениям. Именно поэтому глубокие сети часто требуют серьёзной инфраструктуры и времени на обучение. В практических проектах качество чаще чинится данными и сценариями, а не “добавим ещё слоёв”.
Трансформер — архитектура, которая хорошо учитывает контекст в тексте и связи между словами и фразами. Благодаря этому трансформеры стали основой для современных языковых моделей и ассистентов. В прикладных задачах это значит, что модель лучше держит тему разговора и меньше “теряет хвост” длинной переписки. Но трансформер не “думает как человек” — он статистически предсказывает продолжение по закономерностям в данных.
LLM — это модель для работы с текстом: она пишет, объясняет, пересказывает, структурирует и помогает формулировать ответы. Её сила — в естественном языке и умении работать с контекстом, поэтому LLM часто используют как “мозг” ассистентов. При этом LLM может ошибаться и уверенно додумывать детали, если у неё нет источников или вы не задали рамки. В бизнесе LLM почти всегда используют вместе с правилами, проверками и часто — с подключением базы знаний.
VLM работает с изображениями и текстом одновременно: может понимать картинку и объяснять её словами, сопоставлять визуальное и описание. Это удобно в процессах, где есть фото, сканы, карточки товаров, документы и визуальный контроль. Но качество VLM зависит от сценария и данных: важно заранее определить, что считать ошибкой и что считать нормой. Без этих рамок модель будет давать расплывчатые ответы, которые сложно применить в бизнесе.
Диффузионные модели — популярный класс генеративных моделей для создания изображений. Они хорошо генерируют варианты стиля, фона и композиции, помогают быстро получить набор черновых концептов. В бизнесе это чаще инструмент ускорения, а не “готовый дизайн одной кнопкой”: результат нужно отбирать и доводить. Чтобы выдача была предсказуемой, обычно задают ограничения по стилю, бренду и содержанию.
Классификатор (Classifier)
Классификатор — модель, которая выбирает категорию из заранее заданных вариантов. Он полезен, когда нужно быстро распределять поток: обращения, документы, отзывы, заявки. Главное — чтобы категории были понятными и не пересекались слишком сильно, иначе модель будет путаться. И всегда нужен вариант “другое/непонятно”, иначе система начнёт притворяться уверенной там, где не должна.
Регрессор — модель, которая предсказывает число, а не категорию. Обычно это прогнозирование: спрос, сроки, вероятность события, ожидаемая выручка. Регрессия работает хорошо, если есть история и закономерности, но плохо переносит резкие изменения рынка и сезонность без учёта факторов. Поэтому хорошие прогнозы — это не только модель, но и правильные признаки, периодичность и здравый смысл.
Галлюцинация — это когда языковая модель выдаёт правдоподобный, но неверный ответ, часто уверенным тоном. Это не “поломка”, а побочный эффект генерации: модель стремится продолжить текст логично, даже если точных данных нет. В бизнесе это опасно там, где цена ошибки высокая: условия, документы, цифры, регламенты. Поэтому в прикладных сценариях важны источники, ограничения, проверки и контроль качества.
Бенчмарк — это набор тестов, по которому сравнивают модели или проверяют качество вашей системы. Хороший бенчмарк отражает реальные задачи бизнеса, а не “красивые тесты ради галочки”. Он помогает выбрать решение по фактам, а не по впечатлениям, и нужен не только на старте, но и после обновлений. Без бенчмарка качество обычно “падает тихо”: пользователи недовольны, а в отчётах всё нормально.