AI для разработчиков 21 мин чтения 20 мая 2026

Российский AI-стек 2026: чем заменить OpenAI, Claude и Gemini

Что есть в РФ вместо OpenAI и Claude: YandexGPT 5, GigaChat 3, T-Pro, Cotype, Kandinsky 4, open-source self-hosting. Цены, код подключения, кейсы.

AIYandexGPTGigaChatроссийский AIимпортозамещение

Коротко (TL;DR)

С 2022 года OpenAI, Anthropic, Google официально недоступны в РФ — нет оплаты, нет SLA, и любая отправка ПД клиентов на их API нарушает ст. 18 ч. 5 152-ФЗ.
Топ российских моделей в 2026: YandexGPT 5 (Pro/Lite/8B), GigaChat 3 (Max/Pro/Lite), T-Lite/T-Pro от Т-Банка, Cotype Pro от МТС.
Качество на русском у YandexGPT 5 Pro и GigaChat 3 Max — на уровне GPT-4 Turbo. По коду заметно слабее GPT-4o и Claude Sonnet 4.
Для генерации изображений — Kandinsky 4 от Сбера и YandexART 2. Для open-source self-hosting в РФ — Llama 3.3, Qwen 2.5, DeepSeek V3 на Yandex Cloud / VK Cloud / Selectel.
Заказать AI-ассистента на сайт на российском стеке — от 80 тыс ₽ под ключ, локализация ПД, 152-ФЗ соответствие.

Почему нельзя просто использовать OpenAI, Claude и Gemini

За 2024-2026 я перебрал все российские LLM на реальных проектах — от чат-бота для юридической компании до RAG-системы на 10 000 документов. Расскажу что реально работает, а что — маркетинг. Но сначала — почему вообще нельзя продолжать пользоваться западными API.

Причина первая — оплата. OpenAI принимает только зарубежные карты. Российские Visa/MasterCard не работают с весны 2022. Карты UnionPay российских банков OpenAI блокирует на этапе биллинга — проверяют BIN. Anthropic — то же самое. Google Cloud — формально допускает оплату, но российские карты тоже отбивает.

«А можно ли через прокси / зарубежного партнёра / посредника?» — вопрос, который задают чаще всего. Технически — да, можно купить токены через посредника или открыть юрлицо в Казахстане/ОАЭ. Юридически — серая зона. Для бизнеса с регулярными расходами от 100 тыс ₽/мес — это бухгалтерский кошмар и налоговые риски при контролируемых сделках. Для разовых экспериментов — окей, для продакшена — плохая идея.

Причина вторая, более серьёзная — 152-ФЗ. Статья 18 часть 5 требует: персональные данные граждан РФ при сборе должны записываться в базы данных, находящиеся на территории Российской Федерации. Когда вы отправляете в OpenAI текст с email, телефоном, ФИО клиента — вы передаёте ПД на серверы в США. Это прямое нарушение ст. 18 ч. 5, штраф по ч. 8 ст. 13.11 КоАП — от 6 до 18 млн ₽ для ЮЛ, при повторном нарушении — оборотный до 3% выручки.

«А если клиент не возражает?» — не имеет значения. Закон не позволяет получить согласие на нарушение требования о локализации. Согласие на трансграничную передачу — отдельная история, тоже требует уведомления РКН и кучи условий. Подробнее эту тему разбирал в статье о локализации ПД.

Причина третья — стабильность. С 2022 года OpenAI несколько раз блокировал российские IP-адреса целиком, даже через VPN. Anthropic блокирует жёстче — если детектят что вы из РФ, аккаунт закрывают без возврата средств. Полагаться на это в продакшене — значит однажды утром обнаружить, что весь ваш AI-функционал не работает.

Главный практический вывод. Если вы работаете с ПД российских граждан и обрабатываете их через AI — российский AI-стек это не «патриотический выбор», а единственный легальный путь. Альтернативы — крупный риск штрафов и блокировок.

YandexGPT 5: Pro, Lite и 8B

Флагман российского AI на 2026. Yandex выпустил пятое поколение в марте 2026, три варианта: Pro для качества, Lite для скорости, 8B-open для self-hosting. По моим тестам — самая зрелая экосистема в РФ.

YandexGPT 5 Pro — основная модель. Качество на русском по моим тестам сравнимо с GPT-4 Turbo (но не с GPT-4o и Claude Sonnet 4 — там разрыв ощутим). Контекст 32K токенов, поддержка function calling, JSON mode, мультимодальность (анализ изображений). Цены 2026: 1,2 ₽ за 1000 токенов на вход, 4,8 ₽ за 1000 на выход. Считается через биллинг Yandex Cloud.

Подключение — через API Yandex Cloud Foundation Models. Получаете API-ключ в консоли, делаете запрос:

import requests

API_KEY = "AQVN..."  # ключ из Yandex Cloud IAM
FOLDER_ID = "b1g..."  # ID каталога Yandex Cloud

url = "https://llm.api.cloud.yandex.net/foundationModels/v1/completion"
headers = {
    "Authorization": f"Api-Key {API_KEY}",
    "Content-Type": "application/json",
}
payload = {
    "modelUri": f"gpt://{FOLDER_ID}/yandexgpt/latest",
    "completionOptions": {
        "stream": False,
        "temperature": 0.6,
        "maxTokens": 2000
    },
    "messages": [
        {"role": "system", "text": "Ты юрист по 152-ФЗ. Отвечай чётко, без воды."},
        {"role": "user", "text": "Нужно ли согласие на cookie_id с поведением?"}
    ]
}

r = requests.post(url, json=payload, headers=headers, timeout=60)
data = r.json()
print(data["result"]["alternatives"][0]["message"]["text"])

Что хорошо. Русский язык — на уровне нативного. Понимает региональные речевые обороты, бюрократические формулировки, юридический язык. Function calling работает стабильно — можно встраивать в агентов. SLA — 99,5%.

Что плохо. Код пишет хуже GPT-4o примерно в 1,5-2 раза по моим оценкам. Сложные алгоритмические задачи лучше отдавать DeepSeek/Qwen self-hosted. Контекст 32K — этого мало для длинных юр-документов или больших кодовых баз. Цена за выход (4,8 ₽/1K) выше чем у GigaChat Pro, который не сильно уступает в качестве.

YandexGPT 5 Lite — версия для быстрых задач. Контекст 8K, в 5-7 раз быстрее Pro, цена в 4 раза дешевле (0,3 ₽ вход / 1,2 ₽ выход). Подходит для: классификация сообщений, базовая суммаризация, быстрые ответы в чат-боте, рерайтинг текстов. Для RAG и сложного рассуждения — не годится, теряет нити.

YandexGPT 5 8B — открытая модель в свободном доступе на HuggingFace (с условиями). Можно развернуть у себя на GPU, либо запустить через Yandex Cloud в виде managed-сервиса. Качество — между Lite и Pro, ближе к Lite. Используется для тех случаев, когда нужно полное локальное развёртывание без передачи запросов в облако Yandex.

GigaChat 3 от Сбера

Второй основной игрок российского рынка. Сбер двигается агрессивно: в марте 2026 вышел GigaChat 3 с тремя версиями — Max, Pro, Lite. По моим тестам — на длинных контекстах и в задачах суммаризации догоняют YandexGPT, а в отдельных задачах превосходят.

GigaChat 3 Max — флагман. Контекст 128K токенов (это серьёзное преимущество над YandexGPT с 32K), мультимодальность, function calling. Качество русского — сопоставимо с YandexGPT Pro, в задачах с большим контекстом (RAG, длинные диалоги, анализ объёмных документов) — выше. Цена в 2026: 1,4 ₽ за 1000 токенов на вход, 5,2 ₽ за 1000 на выход.

Подключение — через GigaChat API. Сначала получаете client_credentials в личном кабинете developers.sber.ru:

import requests
import uuid

CLIENT_ID = "..."
CLIENT_SECRET = "..."

# 1) Получаем access_token (живёт 30 минут)
auth = requests.post(
    "https://ngw.devices.sberbank.ru:9443/api/v2/oauth",
    headers={
        "Authorization": f"Basic {CLIENT_SECRET}",
        "RqUID": str(uuid.uuid4()),
        "Content-Type": "application/x-www-form-urlencoded",
    },
    data={"scope": "GIGACHAT_API_PERS"},
    verify=False,  # SSL Минцифры — добавьте свой CA-сертификат
)
token = auth.json()["access_token"]

# 2) Делаем запрос к модели
r = requests.post(
    "https://gigachat.devices.sberbank.ru/api/v1/chat/completions",
    headers={
        "Authorization": f"Bearer {token}",
        "Content-Type": "application/json",
    },
    json={
        "model": "GigaChat-Max",
        "messages": [
            {"role": "system", "content": "Ты эксперт по корпоративным финансам."},
            {"role": "user", "content": "Как оформить ЦФА для b2b-расчётов?"}
        ],
        "temperature": 0.5,
        "max_tokens": 1500,
    },
    verify=False,
)
print(r.json()["choices"][0]["message"]["content"])

Что хорошо. Огромный контекст 128K — реально меняет правила игры для RAG-систем и анализа документов. Глубокая интеграция с экосистемой Сбера — если у вас СберБизнес, СберКорус, Сбер.Банкинг — подключение через одни и те же ключи. Цена для физлиц очень мягкая — есть бесплатный тариф на 1 млн токенов в месяц.

Что плохо. Корневой сертификат «Минцифры» — нестандартный, нужно отдельно добавлять в trust store. Документация местами хаотичная, обновляется реже YandexGPT. Function calling появился позже и пока менее стабилен.

GigaChat 3 Pro — средний тариф, контекст 64K, цена 0,9 ₽ вход / 3,2 ₽ выход. Для большинства задач — оптимальный выбор по соотношению цена/качество.

GigaChat 3 Lite — быстрая модель, контекст 8K, 0,2 ₽ вход / 0,6 ₽ выход. Самый дешёвый вариант на рынке для базовых задач.

T-Bank AI: T-Lite и T-Pro

Т-Банк (бывший Тинькофф) долго двигался скромно, в 2025 запустил собственный AI-стек: T-Lite (8B параметров) и T-Pro (32B параметров). Open-source модели на лицензии Apache 2.0 — можно скачивать с HuggingFace, разворачивать у себя.

Специализация — финансы, e-commerce, клиентское обслуживание. Модели дообучены на финансовых текстах, отчётах, банковских процессах. Если у вас финтех — стоит попробовать в первую очередь, разница в качестве по доменным задачам ощутима.

Лицензия Apache 2.0 — это важно. Можно использовать в коммерческих продуктах без отчислений Т-Банку, разворачивать в любом облаке, дообучать на своих данных. Размер 8B/32B позволяет развернуть на GPU среднего уровня (A100 хватит для T-Pro).

Что плохо. Нет полноценного API-сервиса от Т-Банка для широкого рынка — модель есть, инфраструктуры для подключения «как у YandexGPT» нет. Используется через self-hosting либо в продуктах самого банка.

RuGPT 3.5 от Сбера: legacy open-source

Старая модель от Сбера, выпущена в 2022 году, 13B параметров. Open-source, доступна на HuggingFace, лицензия MIT. По сегодняшним меркам — слабая (хуже Llama 3.3 на русском), но имеет смысл в двух сценариях.

Первый — образование и эксперименты. Полностью открытая, легко разворачивается локально, можно дообучать на собственных данных, есть готовые туториалы. Хороша для обучения работе с LLM в России.

Второй — простые задачи генерации, где нужна предсказуемость и низкая стоимость. Классификация коротких текстов, генерация шаблонных отзывов, простые ответы в FAQ-боте — RuGPT справляется, и стоимость владения может быть ниже чем у API.

Для сложных задач, агентов, RAG-систем — RuGPT в 2026 уже не подходит. Лучше брать YandexGPT 5 8B (тоже open) или Qwen 2.5.

Cotype Pro от МТС

Третий крупный игрок — МТС со своей моделью Cotype, обновлённая версия Cotype Pro вышла в конце 2025. Корпоративная LLM с упором на enterprise-задачи: HR, документооборот, внутренние помощники, чат-боты для крупных компаний. Параметров — около 40B.

Подключение — только через корпоративный контракт с МТС, публичного self-service API нет. Цены на индивидуальной основе, обычно стартуют от 500 тыс ₽/мес за включение в инфраструктуру компании. Качество русского — на уровне GigaChat Pro по моим тестам, специализация — больше под B2B-инфраструктуру, чем под массовый продукт.

Когда брать. Если вы крупная компания с уже подключёнными сервисами МТС Облако / МТС Big Data — Cotype хорошо встраивается в общую инфраструктуру. Если стартап или средний бизнес — выбирайте YandexGPT или GigaChat, там доступнее и быстрее старт.

Генерация изображений: YandexART 2 и Kandinsky 4

Для генерации картинок в российском стеке два главных игрока.

Kandinsky 4 от Сбера — флагман. Качество фотореалистичных изображений — близко к Stable Diffusion 3, в некоторых задачах превосходит. Поддержка text-to-image, image-to-image, inpainting, text-to-video (короткие ролики до 8 секунд). Доступен через GigaChat API и отдельно через kandinsky.ai. Цена — около 2-5 ₽ за изображение.

Что хорошо: открытая модель, есть веса на HuggingFace, лицензия Apache 2.0. Сильно лучше понимает русские промпты, чем Midjourney или DALL-E с переводом. Минусы: уступает Midjourney v6 по художественной выразительности и стилю.

YandexART 2 — модель Yandex. Подключение через тот же Foundation Models API. Качество — сопоставимое с Kandinsky 4, иногда лучше по фотореалистичности. Цена — около 3-7 ₽ за изображение. Не open-source — только через API.

Для бизнеса. Если нужно генерировать иллюстрации для статей, баннеры, обложки — обе модели справятся. Если нужна максимальная художественность — приходится комбинировать: первичная генерация на Kandinsky, доработка/апскейл через локальную SD-модель.

Open-source модели для self-hosting в РФ

Когда выгодно self-hosting. По моим расчётам — при объёме от 50-100 млн токенов в месяц на одну модель, либо при критичности данных, когда нельзя передавать никуда даже в российское облако.

Топовые open-source модели для российского self-hosting в 2026:

Llama 3.3 от Meta — 70B параметров, версия декабря 2024 (Meta запрещена в РФ как организация, но модель формально open-source и юридически использовать можно). Качество на русском — хорошее, на уровне YandexGPT Pro. Запуск — GPU A100 (80GB) или две A100 (40GB) в режиме tensor parallel.

Qwen 2.5 от Alibaba — 72B параметров, отличная мультиязычная поддержка, русский язык — на удивление хороший. Apache 2.0, разворачивается так же как Llama. По кодингу — лучше Llama в моих тестах. Особенно сильна Qwen 2.5-Coder 32B — оптимизирована под программирование.

DeepSeek V3 / R1 — китайская модель, 671B параметров (MoE-архитектура, активных 37B). На уровне GPT-4o по большинству задач. Apache 2.0, можно разворачивать у себя. Требует серьёзного железа — минимум 8x H100 для нормальной скорости.

YandexGPT 5 8B — open-source версия от Yandex. Меньше параметров, но заточена под русский. Хороший вариант для базовых задач если важна полная локальность.

Инфраструктура. Аренда GPU в РФ — Yandex Cloud, VK Cloud, Selectel, Cloud.ru (Сбер). Цены на 2026 (примерные):

A100 40GB — 180-250 тыс ₽/мес;
A100 80GB — 280-380 тыс ₽/мес;
H100 80GB — 450-650 тыс ₽/мес;
RTX 4090 (для экспериментов) — 25-40 тыс ₽/мес.

Развёртывание — через vLLM или TGI (Text Generation Inference). vLLM проще, документация лучше. Один сервер с A100 держит около 30-50 одновременных запросов на Llama 70B при разумной задержке.

Сравнительная таблица всех моделей

Модель	Качество RU	Контекст	Цена in/out, ₽/1K	API	Локализация
YandexGPT 5 Pro	9/10	32K	1,2 / 4,8	Yandex Cloud	РФ
YandexGPT 5 Lite	7/10	8K	0,3 / 1,2	Yandex Cloud	РФ
GigaChat 3 Max	9/10	128K	1,4 / 5,2	Сбер	РФ
GigaChat 3 Pro	8/10	64K	0,9 / 3,2	Сбер	РФ
GigaChat 3 Lite	6/10	8K	0,2 / 0,6	Сбер	РФ
T-Pro 32B	8/10	32K	self-host	—	self
Cotype Pro	8/10	32K	контракт	МТС	РФ
Llama 3.3 70B	8/10	128K	self-host	—	self
Qwen 2.5 72B	8/10	128K	self-host	—	self
DeepSeek V3	9/10	128K	self-host	—	self
YandexART 2	9/10	—	3-7 за img	Yandex Cloud	РФ
Kandinsky 4	9/10	—	2-5 за img	Сбер	РФ

Внедрим AI-ассистента на российском стеке

Чат-бот на сайт с RAG по вашим документам, на YandexGPT или GigaChat, с полным соответствием 152-ФЗ. От 80 тыс ₽ под ключ, 2-4 недели от ТЗ до запуска. У меня сертификаты Vanderbilt и MongoDB по AI-агентам, портфолио — реальные проекты 2024-2026.

Заказать AI-ассистента Обсудить

Кейсы внедрения российских AI в 2024-2026

Что реально работает — по открытым кейсам и моим проектам.

Сбер «Юр-помощник» на GigaChat. Внутренний AI-ассистент для юристов Сбера. Анализирует договоры, проверяет на соответствие политикам, генерирует draft-документы. По открытым данным — ускоряет рутинную юридическую работу в 3-5 раз. Контекст 128K у GigaChat Max — критически важен, помещаются объёмные договоры.

Алиса в Яндексе. Под капотом — YandexGPT 5 в режиме голосового агента. Обрабатывает миллионы запросов в день, работает с function calling — заказы такси, доставка еды, бытовые покупки. Хороший пример продакшен-нагрузки на российской модели.

T-Bank Junior AI. AI-помощник в мобильном приложении Т-Банка для подростковых счетов. Объясняет финансы простым языком, помогает с бюджетированием. Модель — T-Pro дообученная на доменных данных.

Юридический чат-бот для регионального адвокатского бюро (мой проект, 2025). RAG-система на YandexGPT Pro + векторная БД на 4000 решений судов и нормативных актов. Бот отвечает на вопросы граждан по гражданскому праву с цитатами из судебной практики. Качество ответов — около 80% корректных по экспертной оценке, остальные 20% требуют человеческой проверки. Стоимость работы модели — около 25 тыс ₽/мес при 500 диалогах в сутки.

RAG для строительной компании (мой проект, 2026). 10 000 проектных документов и нормативов СНИП в векторной БД (Qdrant), генерация на GigaChat Pro. Сотрудники задают вопросы вроде «какая толщина стен по СНиП для жилого здания 5 этажей в Сочи» — получают ответ с ссылками на конкретные пункты документов. ROI окупился за 4 месяца за счёт ускорения работы проектировщиков.

Юридическая чистота: что можно, что нельзя

Главное правило 2026: персональные данные граждан РФ не передаются на западные API ни через какие прокси и обходные пути. Это базовое требование 152-ФЗ, нарушение которого фиксируется при любой проверке РКН с проверкой логов.

Что можно. Использовать российские модели (YandexGPT, GigaChat, T-Bank, Cotype, RuGPT) — серверы в РФ, локализация автоматически. Использовать open-source модели на self-hosted GPU в российских облаках (Yandex Cloud, VK Cloud, Selectel) — серверы в РФ, легально. Использовать западные модели без передачи ПД — например, для генерации общих текстов без личных данных, через юрлицо в дружественной юрисдикции.

Что нельзя. Отправлять ПД клиентов на api.openai.com, api.anthropic.com, generativelanguage.googleapis.com даже через VPN. Хранить промпт-логи (которые содержат ПД клиентов) в зарубежных хранилищах. Использовать SaaS-инструменты, которые обогащают данные через западные AI без вашего ведома.

Серая зона. Дообучение open-source моделей на данных, не содержащих ПД, может проводиться где угодно. Использование западных моделей для задач, где гарантированно нет ПД (генерация маркетинговых текстов, без личных данных) — формально допустимо, но есть риск что в промпт случайно попадёт ПД от пользователя.

FAQ

Можно ли через прокси использовать GPT-4 для бизнеса в РФ?

Технически — да, через посредников вроде ProxyAPI или зарубежное юрлицо. Юридически с обработкой ПД — нет, это нарушение 152-ФЗ независимо от способа доступа. Для задач без ПД (генерация общих текстов, генерация кода без чувствительной логики) — допустимо, но риск что в продакшене ПД случайно попадут в промпт всегда есть. Я рекомендую: для всего что касается клиентских данных — российский стек, без вариантов.

Что выбрать для чат-бота на сайт?

В 90% случаев — GigaChat 3 Pro или YandexGPT 5 Pro. GigaChat — если важен большой контекст (RAG, длинные диалоги, анализ документов). YandexGPT — если важна стабильность API и максимально знакомая среда разработчика. Для лёгких ботов (FAQ, классификация заявок) — Lite-версии любой из моделей.

YandexGPT vs GPT-4 — насколько серьёзный разрыв?

На русском — небольшой. YandexGPT 5 Pro по моим тестам около 85-90% от GPT-4 Turbo. На английском — разрыв больше, 70-80%. По коду — 60-70% от GPT-4o. По агентным задачам с function calling — 75-80%. Для большинства бизнес-задач разница не критична, особенно если данные на русском.

Как принимать платежи за использование API?

За российские модели — обычно: Yandex Cloud Billing, GigaChat через личный кабинет developers.sber.ru, T-Bank через корпоративный контракт. Принимаются рублёвые карты, расчётный счёт ЮЛ/ИП, оплата по выставленному счёту. Никаких проблем с валютной оплатой и санкциями.

Что если клиент международный?

Если у вас международный SaaS, который работает в РФ + ЕС + США — нужны две инфраструктуры. Для клиентов из РФ — обработка ПД через российские API на российских серверах. Для зарубежных клиентов — можно использовать OpenAI/Anthropic из соответствующих юрисдикций. Архитектурно — два пути обработки в зависимости от региона клиента, с роутингом на уровне приложения.

Open-source vs API — что выбрать?

API: быстрый старт (1 день до прототипа), нет затрат на железо, не нужны MLOps-специалисты, оплата по факту использования, но платите за каждый токен и зависите от провайдера. Self-hosting open-source: высокий старт-аппроп (1-3 месяца до продакшена), нужно железо и команда, но фиксированная стоимость и полная независимость. Граница окупаемости self-hosting — около 50-100 млн токенов в месяц при стабильной нагрузке. Меньше — берите API.

Нужна ли ИТ-аккредитация, чтобы использовать AI?

Нет, ИТ-аккредитация — это про налоговые льготы и отсрочки от армии для ИТ-компаний, к использованию AI отношения не имеет. Но если вы планируете внедрять AI как продукт и продавать другим компаниям — аккредитация даст бонусы по налогу на прибыль (3% вместо 20% до 2030 года) и НДС-льготы для своих ПО-продуктов. Подача — через Минцифры РФ онлайн, занимает 5-10 рабочих дней.

Выводы и рекомендации по сценариям

Российский AI-стек в 2026 — уже не «времянка», а зрелая альтернатива западному. Не так круто как GPT-4o + Claude Sonnet 4 в идеальном мире, но достаточно для 90% бизнес-задач, и единственно легальный путь для работы с ПД клиентов в РФ.

Мои рекомендации по сценариям:

Стартап с MVP, бюджет до 50 тыс ₽/мес на AI: GigaChat 3 Lite или Pro, через Python SDK. Старт за 1 день.
SaaS со 100K+ пользователей: YandexGPT 5 Pro или GigaChat 3 Max. Сервисный SLA, корпоративные тарифы со скидкой, маршрутизация Lite/Pro по сложности задач.
RAG-система с большой базой документов: GigaChat 3 Max за контекст 128K + Qdrant как векторная БД на VK Cloud / Yandex Cloud.
Финтех, банковское приложение: T-Pro (специализация на финансах) или Cotype Pro (корпоративная инфраструктура), self-hosting или enterprise-контракт.
Чат-бот для сайта простого бизнеса: YandexGPT 5 Lite + Telegram-Bot-Api или прямая интеграция с сайтом, бюджет от 5 тыс ₽/мес. Закажите AI-ассистента на сайт — сделаю под ключ.
Полная локальность, корпоративная безопасность: self-hosted Qwen 2.5 72B или Llama 3.3 70B на собственном/арендованном железе в РФ.
Генерация изображений для маркетинга: Kandinsky 4 (дешевле, open) или YandexART 2 (стабильнее).

Что делать прямо сейчас:

Проверьте, что в текущей AI-инфраструктуре нет передачи ПД клиентов на западные API. Это первое, что найдёт РКН при проверке.
Получите тестовые ключи к YandexGPT и GigaChat (бесплатные лимиты на 1М токенов/мес). Прогоните свой реальный кейс на обеих моделях, сравните качество вживую — это занимает день, экономит месяцы.
Если уже на проде с западным AI — спланируйте миграцию. Большинство задач переезжает за 2-4 недели, основное время — на тестирование промптов под новые модели (они реагируют по-разному).

Если разбираетесь сами — отлично, инфраструктура зрелая, документация неплохая, можно справиться. Если нужна помощь с выбором модели, архитектурой RAG, миграцией с OpenAI или разработкой AI-агента под ваш кейс — пишите.

Выбираете AI для бизнеса — разберём ваш кейс

Если стоите перед выбором AI-стека или хотите внедрить чат-бот/AI-ассистента в бизнес — напишите мне в Telegram. У меня сертификаты Vanderbilt и MongoDB по AI-агентам, на счету десяток внедрений на российском стеке (YandexGPT, GigaChat, self-hosted Qwen). За 30 минут разбора бесплатно подскажу: какая модель подходит под вашу задачу, какой архитектурой собирать, сколько это будет стоить и где основные подводные камни.

Написать Чимитдоржи

Услуги по теме

Что я делаю по AI для бизнеса

AI-агенты и LLM-решения под задачу
RAG-системы (10 000+ документов в портфолио)
AI-чат-бот на сайт за 5-7 дней
Локальный LLM на вашем сервере (приватно)
MCP-интеграции с CRM, БД, корпоративными системами

Написать в Telegram

Бесплатно: чек-лист «Готов ли ваш бизнес к 152-ФЗ»

12 пунктов, которые проверяют готовность за час: данные, согласия, уведомление в РКН, локализация, защита. Отметьте, что уже сделано, и увидите дыры, за которые сейчас штрафуют.

Открыть чек-лист

Готовы обсудить вашу задачу?

Бесплатная консультация — разберём, как внедрить это в вашем бизнесе под ключ. Без форм, пишите напрямую.

Заказать AI-ассистента Telegram ВКонтакте

Готовые решения под ключ 449 готовых IT-решений для бизнеса Автоматизация, боты, AI, 152-ФЗ и платформы · бесплатная консультация Смотреть каталог