Fine-tuning, RAG или API: что выбрать бизнесу для AI
Три подхода к AI — API, RAG и fine-tuning — это инструменты под разные задачи, а не конкуренты. Разбираю, когда что выбрать, как считать бюджет и почему дообучение нужно реже, чем кажется.
Коротко (TL;DR)
- У бизнеса для AI есть три базовых подхода: прямой вызов готовой модели через API, RAG с поиском по своим документам и fine-tuning — дообучение модели под задачу. Это не конкуренты, а разные инструменты под разные задачи.
- API подходит для типовых задач без секретных данных и собственной базы знаний. RAG нужен, когда ответы лежат в ваших документах и важна точность со ссылкой на источник. Fine-tuning — когда нужен особый стиль, формат или узкая специализация.
- В большинстве бизнес-кейсов выигрывает RAG или связка RAG плюс API. Fine-tuning дорог, требует данных и переобучения при изменениях, поэтому к нему стоит подходить осознанно, а не по моде.
- Выбор зависит от данных, бюджета и требований 152-ФЗ. С персональными данными — российский AI-стек GigaChat и YandexGPT или локальные модели. Я помогаю подобрать подход честно, без навязывания дорогого решения и без гарантий чудес.
Три подхода к AI: о чём вообще идёт речь
Меня зовут Чимитдоржи Дарижапов, я консультант по внедрению AI. Самый частый вопрос, который мне задают: «нам нужно дообучить модель под наш бизнес, сколько это стоит?» И почти всегда выясняется, что дообучение — последнее, что им на самом деле нужно. Эта статья — карта, которая поможет вам не платить за лишнее.
Когда бизнес хочет «свой AI», за этим стоит один из трёх технических путей, и важно понимать разницу между ними.
- API. Вы обращаетесь к готовой модели и получаете ответ. Модель не знает ваших данных, но умеет рассуждать, писать тексты, классифицировать, переводить.
- RAG. Перед ответом модель получает нужные фрагменты ваших документов и отвечает строго по ним со ссылкой на источник. Это способ дать модели ваши знания без её переобучения.
- Fine-tuning. Вы дообучаете саму модель на своих примерах, меняя её поведение — стиль, формат, узкую специализацию.
Ключевая мысль, которую я повторяю каждому клиенту: это не три конкурирующих варианта «что лучше», а три инструмента под разные задачи. Их часто комбинируют. Дальше разберу каждый по отдельности и дам понятные критерии выбора.
API: когда хватает готовой модели
Самый простой и дешёвый путь — обращаться к готовой модели через API. Вы не храните модель, не обучаете её, просто отправляете запрос и получаете ответ.
Где API — правильный выбор:
- Генерация текстов. Черновики писем, описания товаров, посты, краткие пересказы.
- Классификация и разметка. Распределение обращений по темам, оценка тональности, извлечение данных из текста.
- Перевод и переформулирование. Адаптация текстов под аудиторию и каналы.
- Простые ассистенты. Когда вся нужная информация умещается в одну инструкцию и не требует поиска по большой базе.
Плюсы API очевидны: быстрый старт, минимальная стоимость входа, нет инфраструктуры. Минусы тоже важны: модель не знает ваших данных, и при отправке чувствительной информации возникает вопрос 152-ФЗ. Для задач с персональными данными в России используют российский AI-стек — GigaChat или YandexGPT, доступные через отечественные облака с понятными условиями.
Частая ошибка — пытаться через API решить задачу, где нужна собственная база знаний. Вы будете либо вставлять в каждый запрос гору текста, упираясь в лимиты, либо получать выдуманные ответы. Это сигнал, что вам нужен RAG, а не более хитрый промпт.
RAG: когда ответы лежат в ваших документах
RAG — генерация, дополненная поиском — это способ дать модели ваши знания без переобучения. Перед каждым ответом система находит в вашей базе подходящие фрагменты и передаёт их модели с инструкцией отвечать только по ним.
Когда RAG — правильный выбор:
- Большая база документов. Регламенты, договоры, инструкции, накопленные за годы, по которым нужно искать.
- Требуется точность и ссылка на источник. В юридических, технических, финансовых задачах ответ без источника бесполезен.
- Данные часто меняются. Обновили документ — переиндексировали, и ассистент уже отвечает по-новому, без переобучения модели.
- Чувствительные данные. RAG отлично сочетается с локальными и российскими моделями, удерживая данные внутри периметра.
Главное достоинство RAG — он отделяет знания от модели. Знания живут в вашей базе, модель лишь формулирует ответ. Это дёшево обновлять, легко проверять и безопасно с точки зрения данных. По моему опыту, именно RAG закрывает большинство реальных бизнес-задач, которые клиенты сначала формулируют как «надо дообучить модель».
Ограничения тоже есть. RAG не меняет манеру модели говорить и не учит её новым навыкам — он лишь снабжает её фактами. Если вам нужен особый стиль ответов или узкая специализация — одного RAG может не хватить, и тогда в игру вступает fine-tuning.
Fine-tuning: когда нужно менять поведение модели
Fine-tuning — это дообучение самой модели на ваших примерах. Вы показываете ей сотни или тысячи пар «запрос — желаемый ответ», и она перенимает нужное поведение.
Где fine-tuning действительно оправдан:
- Устойчивый стиль и тон. Когда нужно, чтобы модель всегда отвечала в фирменной манере бренда без длинных инструкций.
- Строгий формат вывода. Когда ответы должны идти в жёсткой структуре, и обычным промптом стабильности не добиться.
- Узкая специализация. Специфический отраслевой язык, термины, шаблоны рассуждений.
- Сокращение длины промпта. Когда повторяющиеся инструкции можно «вшить» в модель и экономить на каждом запросе.
Но честно про минусы. Fine-tuning требует качественного набора данных, которого у большинства компаний просто нет. Он дороже и дольше остальных подходов. При изменении задачи модель надо переобучать. И, что критично, fine-tuning не добавляет модели фактов из вашей базы — для фактов всё равно нужен RAG. Поэтому я отношусь к нему как к специальному инструменту, а не как к стартовой точке.
Чаще всего, когда клиент уверен, что ему нужен fine-tuning, на деле решается всё связкой грамотного промпта и RAG. К дообучению я перехожу, только когда испробованы более простые пути и есть реальные данные для обучения.
Как выбрать: пошаговый алгоритм
Чтобы не гадать, я использую простую последовательность вопросов. Пройдите по ней мысленно для своей задачи.
- Есть ли у вас своя база знаний, по которой нужно отвечать? Если нет — скорее всего достаточно API с хорошим промптом. Если да — переходите дальше.
- Важна ли точность и ссылка на источник? Если да — это RAG. Большинство задач с документами останавливается здесь.
- Устраивает ли стиль и формат ответов модели? Если да — RAG достаточно. Если модель упорно отвечает не так, как нужно, несмотря на инструкции — рассмотрите fine-tuning поверх RAG.
- Есть ли у вас данные для дообучения? Без нескольких сотен качественных примеров fine-tuning не взлетит. Нет данных — нет fine-tuning.
- Какие требования по данным? Есть персональные данные или коммерческая тайна — выбираем российский стек или локальные модели и закладываем 152-ФЗ.
В реальных проектах ответ почти всегда — RAG или связка RAG плюс API. Fine-tuning подключается как добавка для стиля и специализации, а не как фундамент. Этот порядок защищает бюджет: вы не платите за дорогое решение там, где хватает простого.
Комбинации подходов и стоимость
На практике подходы редко используются в чистом виде. Несколько типовых комбинаций, которые встречаются чаще всего.
- API плюс промпт. Самый дешёвый и быстрый старт для типовых задач без своей базы.
- RAG плюс API. Рабочая лошадка для большинства корпоративных ассистентов: поиск по документам и готовая модель для генерации.
- RAG плюс локальная модель. Когда данные особенно чувствительны и не должны покидать ваши серверы.
- Fine-tuning плюс RAG. Дообучение для стиля и формата, RAG для фактов. Сложный, но иногда оправданный вариант.
По стоимости и срокам ориентир такой. Решение на API запускается быстрее всего и дешевле всего на старте. RAG требует больше работы на сбор и подготовку данных, но даёт качественный и контролируемый результат. Fine-tuning — самый затратный путь по данным, времени и поддержке. Точные цифры зависят от объёма данных, требований к безопасности и интеграциям, и я всегда называю их после аудита, а не наугад.
Чего я принципиально не делаю — не предлагаю дорогое дообучение там, где задача закрывается RAG. Это вопрос честности и долгого доверия, а не разовой выручки.
Частые вопросы
Нам точно нужно дообучать модель под наш бизнес?
В большинстве случаев — нет. Если задача в том, чтобы модель отвечала по вашим документам, это решается RAG без дообучения. Fine-tuning нужен, когда требуется особый стиль, строгий формат или узкая специализация и при этом есть данные для обучения. Сначала стоит испробовать более простые подходы.
Чем RAG отличается от fine-tuning по сути?
RAG снабжает модель фактами из вашей базы в момент ответа, не меняя саму модель. Fine-tuning меняет поведение модели, но не добавляет ей фактов. Для знаний нужен RAG, для манеры и формата — fine-tuning. Часто их сочетают, но начинают почти всегда с RAG.
Можно ли использовать зарубежные модели для российского бизнеса?
Если в данных нет персональной информации и коммерческой тайны — иногда можно, но всегда сверяйтесь с корпоративной политикой. С персональными данными в России безопаснее российский AI-стек — GigaChat, YandexGPT — или локальные модели, чтобы соблюдать 152-ФЗ.
Какой подход самый дешёвый?
На старте дешевле всего API с хорошим промптом, потому что нет инфраструктуры и обучения. Но если задача требует своей базы знаний, экономия мнимая — вы упрётесь в лимиты и качество. Тогда RAG оказывается выгоднее в перспективе, несмотря на больший вход.
Сколько времени занимает выбор и запуск?
Сам выбор подхода — это вопрос короткого аудита задачи и данных. Запуск решения на API быстрый, RAG требует времени на подготовку базы, fine-tuning — самый долгий из-за сбора данных и обучения. Конкретные сроки я называю после того, как посмотрю ваш кейс, а не заранее.
Коротко о главном
API, RAG и fine-tuning — это три инструмента под разные задачи, а не соревнование «что лучше». API хорош для типовых задач без своей базы, RAG — когда ответы лежат в ваших документах и нужна точность со ссылкой, fine-tuning — когда требуется менять стиль и специализацию модели и есть данные для обучения.
В большинстве бизнес-кейсов выигрывает RAG или связка RAG плюс API, а fine-tuning подключается осознанно как добавка. Выбор всегда зависит от ваших данных, бюджета и требований 152-ФЗ. Я не навязываю дорогих решений и не обещаю чудес — я помогаю подобрать подход под реальную задачу и даю честную оценку. Напишите мне в мессенджер, разберём ваш случай и определим оптимальный путь.
Что я делаю
- Подбор AI-подхода под задачу
- Внедрение RAG на своих данных
- Интеграция через API
- Дообучение модели при необходимости
- Честная оценка бюджета и сроков
Готовы обсудить вашу задачу?
Бесплатная консультация — разберём, как внедрить это в вашем бизнесе под ключ. Без форм, пишите напрямую.