Российский AI-стек 2026: чем заменить OpenAI, Claude и Gemini
Что есть в РФ вместо OpenAI и Claude: YandexGPT 5, GigaChat 3, T-Pro, Cotype, Kandinsky 4, open-source self-hosting. Цены, код подключения, кейсы.
Коротко (TL;DR)
- С 2022 года OpenAI, Anthropic, Google официально недоступны в РФ — нет оплаты, нет SLA, и любая отправка ПД клиентов на их API нарушает ст. 18 ч. 5 152-ФЗ.
- Топ российских моделей в 2026: YandexGPT 5 (Pro/Lite/8B), GigaChat 3 (Max/Pro/Lite), T-Lite/T-Pro от Т-Банка, Cotype Pro от МТС.
- Качество на русском у YandexGPT 5 Pro и GigaChat 3 Max — на уровне GPT-4 Turbo. По коду заметно слабее GPT-4o и Claude Sonnet 4.
- Для генерации изображений — Kandinsky 4 от Сбера и YandexART 2. Для open-source self-hosting в РФ — Llama 3.3, Qwen 2.5, DeepSeek V3 на Yandex Cloud / VK Cloud / Selectel.
- Заказать AI-ассистента на сайт на российском стеке — от 80 тыс ₽ под ключ, локализация ПД, 152-ФЗ соответствие.
Почему нельзя просто использовать OpenAI, Claude и Gemini
За 2024-2026 я перебрал все российские LLM на реальных проектах — от чат-бота для юридической компании до RAG-системы на 10 000 документов. Расскажу что реально работает, а что — маркетинг. Но сначала — почему вообще нельзя продолжать пользоваться западными API.
Причина первая — оплата. OpenAI принимает только зарубежные карты. Российские Visa/MasterCard не работают с весны 2022. Карты UnionPay российских банков OpenAI блокирует на этапе биллинга — проверяют BIN. Anthropic — то же самое. Google Cloud — формально допускает оплату, но российские карты тоже отбивает.
«А можно ли через прокси / зарубежного партнёра / посредника?» — вопрос, который задают чаще всего. Технически — да, можно купить токены через посредника или открыть юрлицо в Казахстане/ОАЭ. Юридически — серая зона. Для бизнеса с регулярными расходами от 100 тыс ₽/мес — это бухгалтерский кошмар и налоговые риски при контролируемых сделках. Для разовых экспериментов — окей, для продакшена — плохая идея.
Причина вторая, более серьёзная — 152-ФЗ. Статья 18 часть 5 требует: персональные данные граждан РФ при сборе должны записываться в базы данных, находящиеся на территории Российской Федерации. Когда вы отправляете в OpenAI текст с email, телефоном, ФИО клиента — вы передаёте ПД на серверы в США. Это прямое нарушение ст. 18 ч. 5, штраф по ч. 8 ст. 13.11 КоАП — от 6 до 18 млн ₽ для ЮЛ, при повторном нарушении — оборотный до 3% выручки.
«А если клиент не возражает?» — не имеет значения. Закон не позволяет получить согласие на нарушение требования о локализации. Согласие на трансграничную передачу — отдельная история, тоже требует уведомления РКН и кучи условий. Подробнее эту тему разбирал в статье о локализации ПД.
Причина третья — стабильность. С 2022 года OpenAI несколько раз блокировал российские IP-адреса целиком, даже через VPN. Anthropic блокирует жёстче — если детектят что вы из РФ, аккаунт закрывают без возврата средств. Полагаться на это в продакшене — значит однажды утром обнаружить, что весь ваш AI-функционал не работает.
YandexGPT 5: Pro, Lite и 8B
Флагман российского AI на 2026. Yandex выпустил пятое поколение в марте 2026, три варианта: Pro для качества, Lite для скорости, 8B-open для self-hosting. По моим тестам — самая зрелая экосистема в РФ.
YandexGPT 5 Pro — основная модель. Качество на русском по моим тестам сравнимо с GPT-4 Turbo (но не с GPT-4o и Claude Sonnet 4 — там разрыв ощутим). Контекст 32K токенов, поддержка function calling, JSON mode, мультимодальность (анализ изображений). Цены 2026: 1,2 ₽ за 1000 токенов на вход, 4,8 ₽ за 1000 на выход. Считается через биллинг Yandex Cloud.
Подключение — через API Yandex Cloud Foundation Models. Получаете API-ключ в консоли, делаете запрос:
import requests
API_KEY = "AQVN..." # ключ из Yandex Cloud IAM
FOLDER_ID = "b1g..." # ID каталога Yandex Cloud
url = "https://llm.api.cloud.yandex.net/foundationModels/v1/completion"
headers = {
"Authorization": f"Api-Key {API_KEY}",
"Content-Type": "application/json",
}
payload = {
"modelUri": f"gpt://{FOLDER_ID}/yandexgpt/latest",
"completionOptions": {
"stream": False,
"temperature": 0.6,
"maxTokens": 2000
},
"messages": [
{"role": "system", "text": "Ты юрист по 152-ФЗ. Отвечай чётко, без воды."},
{"role": "user", "text": "Нужно ли согласие на cookie_id с поведением?"}
]
}
r = requests.post(url, json=payload, headers=headers, timeout=60)
data = r.json()
print(data["result"]["alternatives"][0]["message"]["text"])
Что хорошо. Русский язык — на уровне нативного. Понимает региональные речевые обороты, бюрократические формулировки, юридический язык. Function calling работает стабильно — можно встраивать в агентов. SLA — 99,5%.
Что плохо. Код пишет хуже GPT-4o примерно в 1,5-2 раза по моим оценкам. Сложные алгоритмические задачи лучше отдавать DeepSeek/Qwen self-hosted. Контекст 32K — этого мало для длинных юр-документов или больших кодовых баз. Цена за выход (4,8 ₽/1K) выше чем у GigaChat Pro, который не сильно уступает в качестве.
YandexGPT 5 Lite — версия для быстрых задач. Контекст 8K, в 5-7 раз быстрее Pro, цена в 4 раза дешевле (0,3 ₽ вход / 1,2 ₽ выход). Подходит для: классификация сообщений, базовая суммаризация, быстрые ответы в чат-боте, рерайтинг текстов. Для RAG и сложного рассуждения — не годится, теряет нити.
YandexGPT 5 8B — открытая модель в свободном доступе на HuggingFace (с условиями). Можно развернуть у себя на GPU, либо запустить через Yandex Cloud в виде managed-сервиса. Качество — между Lite и Pro, ближе к Lite. Используется для тех случаев, когда нужно полное локальное развёртывание без передачи запросов в облако Yandex.
GigaChat 3 от Сбера
Второй основной игрок российского рынка. Сбер двигается агрессивно: в марте 2026 вышел GigaChat 3 с тремя версиями — Max, Pro, Lite. По моим тестам — на длинных контекстах и в задачах суммаризации догоняют YandexGPT, а в отдельных задачах превосходят.
GigaChat 3 Max — флагман. Контекст 128K токенов (это серьёзное преимущество над YandexGPT с 32K), мультимодальность, function calling. Качество русского — сопоставимо с YandexGPT Pro, в задачах с большим контекстом (RAG, длинные диалоги, анализ объёмных документов) — выше. Цена в 2026: 1,4 ₽ за 1000 токенов на вход, 5,2 ₽ за 1000 на выход.
Подключение — через GigaChat API. Сначала получаете client_credentials в личном кабинете developers.sber.ru:
import requests
import uuid
CLIENT_ID = "..."
CLIENT_SECRET = "..."
# 1) Получаем access_token (живёт 30 минут)
auth = requests.post(
"https://ngw.devices.sberbank.ru:9443/api/v2/oauth",
headers={
"Authorization": f"Basic {CLIENT_SECRET}",
"RqUID": str(uuid.uuid4()),
"Content-Type": "application/x-www-form-urlencoded",
},
data={"scope": "GIGACHAT_API_PERS"},
verify=False, # SSL Минцифры — добавьте свой CA-сертификат
)
token = auth.json()["access_token"]
# 2) Делаем запрос к модели
r = requests.post(
"https://gigachat.devices.sberbank.ru/api/v1/chat/completions",
headers={
"Authorization": f"Bearer {token}",
"Content-Type": "application/json",
},
json={
"model": "GigaChat-Max",
"messages": [
{"role": "system", "content": "Ты эксперт по корпоративным финансам."},
{"role": "user", "content": "Как оформить ЦФА для b2b-расчётов?"}
],
"temperature": 0.5,
"max_tokens": 1500,
},
verify=False,
)
print(r.json()["choices"][0]["message"]["content"])
Что хорошо. Огромный контекст 128K — реально меняет правила игры для RAG-систем и анализа документов. Глубокая интеграция с экосистемой Сбера — если у вас СберБизнес, СберКорус, Сбер.Банкинг — подключение через одни и те же ключи. Цена для физлиц очень мягкая — есть бесплатный тариф на 1 млн токенов в месяц.
Что плохо. Корневой сертификат «Минцифры» — нестандартный, нужно отдельно добавлять в trust store. Документация местами хаотичная, обновляется реже YandexGPT. Function calling появился позже и пока менее стабилен.
GigaChat 3 Pro — средний тариф, контекст 64K, цена 0,9 ₽ вход / 3,2 ₽ выход. Для большинства задач — оптимальный выбор по соотношению цена/качество.
GigaChat 3 Lite — быстрая модель, контекст 8K, 0,2 ₽ вход / 0,6 ₽ выход. Самый дешёвый вариант на рынке для базовых задач.
T-Bank AI: T-Lite и T-Pro
Т-Банк (бывший Тинькофф) долго двигался скромно, в 2025 запустил собственный AI-стек: T-Lite (8B параметров) и T-Pro (32B параметров). Open-source модели на лицензии Apache 2.0 — можно скачивать с HuggingFace, разворачивать у себя.
Специализация — финансы, e-commerce, клиентское обслуживание. Модели дообучены на финансовых текстах, отчётах, банковских процессах. Если у вас финтех — стоит попробовать в первую очередь, разница в качестве по доменным задачам ощутима.
Лицензия Apache 2.0 — это важно. Можно использовать в коммерческих продуктах без отчислений Т-Банку, разворачивать в любом облаке, дообучать на своих данных. Размер 8B/32B позволяет развернуть на GPU среднего уровня (A100 хватит для T-Pro).
Что плохо. Нет полноценного API-сервиса от Т-Банка для широкого рынка — модель есть, инфраструктуры для подключения «как у YandexGPT» нет. Используется через self-hosting либо в продуктах самого банка.
RuGPT 3.5 от Сбера: legacy open-source
Старая модель от Сбера, выпущена в 2022 году, 13B параметров. Open-source, доступна на HuggingFace, лицензия MIT. По сегодняшним меркам — слабая (хуже Llama 3.3 на русском), но имеет смысл в двух сценариях.
Первый — образование и эксперименты. Полностью открытая, легко разворачивается локально, можно дообучать на собственных данных, есть готовые туториалы. Хороша для обучения работе с LLM в России.
Второй — простые задачи генерации, где нужна предсказуемость и низкая стоимость. Классификация коротких текстов, генерация шаблонных отзывов, простые ответы в FAQ-боте — RuGPT справляется, и стоимость владения может быть ниже чем у API.
Для сложных задач, агентов, RAG-систем — RuGPT в 2026 уже не подходит. Лучше брать YandexGPT 5 8B (тоже open) или Qwen 2.5.
Cotype Pro от МТС
Третий крупный игрок — МТС со своей моделью Cotype, обновлённая версия Cotype Pro вышла в конце 2025. Корпоративная LLM с упором на enterprise-задачи: HR, документооборот, внутренние помощники, чат-боты для крупных компаний. Параметров — около 40B.
Подключение — только через корпоративный контракт с МТС, публичного self-service API нет. Цены на индивидуальной основе, обычно стартуют от 500 тыс ₽/мес за включение в инфраструктуру компании. Качество русского — на уровне GigaChat Pro по моим тестам, специализация — больше под B2B-инфраструктуру, чем под массовый продукт.
Когда брать. Если вы крупная компания с уже подключёнными сервисами МТС Облако / МТС Big Data — Cotype хорошо встраивается в общую инфраструктуру. Если стартап или средний бизнес — выбирайте YandexGPT или GigaChat, там доступнее и быстрее старт.
Генерация изображений: YandexART 2 и Kandinsky 4
Для генерации картинок в российском стеке два главных игрока.
Kandinsky 4 от Сбера — флагман. Качество фотореалистичных изображений — близко к Stable Diffusion 3, в некоторых задачах превосходит. Поддержка text-to-image, image-to-image, inpainting, text-to-video (короткие ролики до 8 секунд). Доступен через GigaChat API и отдельно через kandinsky.ai. Цена — около 2-5 ₽ за изображение.
Что хорошо: открытая модель, есть веса на HuggingFace, лицензия Apache 2.0. Сильно лучше понимает русские промпты, чем Midjourney или DALL-E с переводом. Минусы: уступает Midjourney v6 по художественной выразительности и стилю.
YandexART 2 — модель Yandex. Подключение через тот же Foundation Models API. Качество — сопоставимое с Kandinsky 4, иногда лучше по фотореалистичности. Цена — около 3-7 ₽ за изображение. Не open-source — только через API.
Для бизнеса. Если нужно генерировать иллюстрации для статей, баннеры, обложки — обе модели справятся. Если нужна максимальная художественность — приходится комбинировать: первичная генерация на Kandinsky, доработка/апскейл через локальную SD-модель.
Open-source модели для self-hosting в РФ
Когда выгодно self-hosting. По моим расчётам — при объёме от 50-100 млн токенов в месяц на одну модель, либо при критичности данных, когда нельзя передавать никуда даже в российское облако.
Топовые open-source модели для российского self-hosting в 2026:
Llama 3.3 от Meta — 70B параметров, версия декабря 2024 (Meta запрещена в РФ как организация, но модель формально open-source и юридически использовать можно). Качество на русском — хорошее, на уровне YandexGPT Pro. Запуск — GPU A100 (80GB) или две A100 (40GB) в режиме tensor parallel.
Qwen 2.5 от Alibaba — 72B параметров, отличная мультиязычная поддержка, русский язык — на удивление хороший. Apache 2.0, разворачивается так же как Llama. По кодингу — лучше Llama в моих тестах. Особенно сильна Qwen 2.5-Coder 32B — оптимизирована под программирование.
DeepSeek V3 / R1 — китайская модель, 671B параметров (MoE-архитектура, активных 37B). На уровне GPT-4o по большинству задач. Apache 2.0, можно разворачивать у себя. Требует серьёзного железа — минимум 8x H100 для нормальной скорости.
YandexGPT 5 8B — open-source версия от Yandex. Меньше параметров, но заточена под русский. Хороший вариант для базовых задач если важна полная локальность.
Инфраструктура. Аренда GPU в РФ — Yandex Cloud, VK Cloud, Selectel, Cloud.ru (Сбер). Цены на 2026 (примерные):
- A100 40GB — 180-250 тыс ₽/мес;
- A100 80GB — 280-380 тыс ₽/мес;
- H100 80GB — 450-650 тыс ₽/мес;
- RTX 4090 (для экспериментов) — 25-40 тыс ₽/мес.
Развёртывание — через vLLM или TGI (Text Generation Inference). vLLM проще, документация лучше. Один сервер с A100 держит около 30-50 одновременных запросов на Llama 70B при разумной задержке.
Сравнительная таблица всех моделей
| Модель | Качество RU | Контекст | Цена in/out, ₽/1K | API | Локализация |
|---|---|---|---|---|---|
| YandexGPT 5 Pro | 9/10 | 32K | 1,2 / 4,8 | Yandex Cloud | РФ |
| YandexGPT 5 Lite | 7/10 | 8K | 0,3 / 1,2 | Yandex Cloud | РФ |
| GigaChat 3 Max | 9/10 | 128K | 1,4 / 5,2 | Сбер | РФ |
| GigaChat 3 Pro | 8/10 | 64K | 0,9 / 3,2 | Сбер | РФ |
| GigaChat 3 Lite | 6/10 | 8K | 0,2 / 0,6 | Сбер | РФ |
| T-Pro 32B | 8/10 | 32K | self-host | — | self |
| Cotype Pro | 8/10 | 32K | контракт | МТС | РФ |
| Llama 3.3 70B | 8/10 | 128K | self-host | — | self |
| Qwen 2.5 72B | 8/10 | 128K | self-host | — | self |
| DeepSeek V3 | 9/10 | 128K | self-host | — | self |
| YandexART 2 | 9/10 | — | 3-7 за img | Yandex Cloud | РФ |
| Kandinsky 4 | 9/10 | — | 2-5 за img | Сбер | РФ |
Внедрим AI-ассистента на российском стеке
Чат-бот на сайт с RAG по вашим документам, на YandexGPT или GigaChat, с полным соответствием 152-ФЗ. От 80 тыс ₽ под ключ, 2-4 недели от ТЗ до запуска. У меня сертификаты Vanderbilt и MongoDB по AI-агентам, портфолио — реальные проекты 2024-2026.
Кейсы внедрения российских AI в 2024-2026
Что реально работает — по открытым кейсам и моим проектам.
Сбер «Юр-помощник» на GigaChat. Внутренний AI-ассистент для юристов Сбера. Анализирует договоры, проверяет на соответствие политикам, генерирует draft-документы. По открытым данным — ускоряет рутинную юридическую работу в 3-5 раз. Контекст 128K у GigaChat Max — критически важен, помещаются объёмные договоры.
Алиса в Яндексе. Под капотом — YandexGPT 5 в режиме голосового агента. Обрабатывает миллионы запросов в день, работает с function calling — заказы такси, доставка еды, бытовые покупки. Хороший пример продакшен-нагрузки на российской модели.
T-Bank Junior AI. AI-помощник в мобильном приложении Т-Банка для подростковых счетов. Объясняет финансы простым языком, помогает с бюджетированием. Модель — T-Pro дообученная на доменных данных.
Юридический чат-бот для регионального адвокатского бюро (мой проект, 2025). RAG-система на YandexGPT Pro + векторная БД на 4000 решений судов и нормативных актов. Бот отвечает на вопросы граждан по гражданскому праву с цитатами из судебной практики. Качество ответов — около 80% корректных по экспертной оценке, остальные 20% требуют человеческой проверки. Стоимость работы модели — около 25 тыс ₽/мес при 500 диалогах в сутки.
RAG для строительной компании (мой проект, 2026). 10 000 проектных документов и нормативов СНИП в векторной БД (Qdrant), генерация на GigaChat Pro. Сотрудники задают вопросы вроде «какая толщина стен по СНиП для жилого здания 5 этажей в Сочи» — получают ответ с ссылками на конкретные пункты документов. ROI окупился за 4 месяца за счёт ускорения работы проектировщиков.
Юридическая чистота: что можно, что нельзя
Главное правило 2026: персональные данные граждан РФ не передаются на западные API ни через какие прокси и обходные пути. Это базовое требование 152-ФЗ, нарушение которого фиксируется при любой проверке РКН с проверкой логов.
Что можно. Использовать российские модели (YandexGPT, GigaChat, T-Bank, Cotype, RuGPT) — серверы в РФ, локализация автоматически. Использовать open-source модели на self-hosted GPU в российских облаках (Yandex Cloud, VK Cloud, Selectel) — серверы в РФ, легально. Использовать западные модели без передачи ПД — например, для генерации общих текстов без личных данных, через юрлицо в дружественной юрисдикции.
Что нельзя. Отправлять ПД клиентов на api.openai.com, api.anthropic.com, generativelanguage.googleapis.com даже через VPN. Хранить промпт-логи (которые содержат ПД клиентов) в зарубежных хранилищах. Использовать SaaS-инструменты, которые обогащают данные через западные AI без вашего ведома.
Серая зона. Дообучение open-source моделей на данных, не содержащих ПД, может проводиться где угодно. Использование западных моделей для задач, где гарантированно нет ПД (генерация маркетинговых текстов, без личных данных) — формально допустимо, но есть риск что в промпт случайно попадёт ПД от пользователя.
FAQ
Можно ли через прокси использовать GPT-4 для бизнеса в РФ?
Технически — да, через посредников вроде ProxyAPI или зарубежное юрлицо. Юридически с обработкой ПД — нет, это нарушение 152-ФЗ независимо от способа доступа. Для задач без ПД (генерация общих текстов, генерация кода без чувствительной логики) — допустимо, но риск что в продакшене ПД случайно попадут в промпт всегда есть. Я рекомендую: для всего что касается клиентских данных — российский стек, без вариантов.
Что выбрать для чат-бота на сайт?
В 90% случаев — GigaChat 3 Pro или YandexGPT 5 Pro. GigaChat — если важен большой контекст (RAG, длинные диалоги, анализ документов). YandexGPT — если важна стабильность API и максимально знакомая среда разработчика. Для лёгких ботов (FAQ, классификация заявок) — Lite-версии любой из моделей.
YandexGPT vs GPT-4 — насколько серьёзный разрыв?
На русском — небольшой. YandexGPT 5 Pro по моим тестам около 85-90% от GPT-4 Turbo. На английском — разрыв больше, 70-80%. По коду — 60-70% от GPT-4o. По агентным задачам с function calling — 75-80%. Для большинства бизнес-задач разница не критична, особенно если данные на русском.
Как принимать платежи за использование API?
За российские модели — обычно: Yandex Cloud Billing, GigaChat через личный кабинет developers.sber.ru, T-Bank через корпоративный контракт. Принимаются рублёвые карты, расчётный счёт ЮЛ/ИП, оплата по выставленному счёту. Никаких проблем с валютной оплатой и санкциями.
Что если клиент международный?
Если у вас международный SaaS, который работает в РФ + ЕС + США — нужны две инфраструктуры. Для клиентов из РФ — обработка ПД через российские API на российских серверах. Для зарубежных клиентов — можно использовать OpenAI/Anthropic из соответствующих юрисдикций. Архитектурно — два пути обработки в зависимости от региона клиента, с роутингом на уровне приложения.
Open-source vs API — что выбрать?
API: быстрый старт (1 день до прототипа), нет затрат на железо, не нужны MLOps-специалисты, оплата по факту использования, но платите за каждый токен и зависите от провайдера. Self-hosting open-source: высокий старт-аппроп (1-3 месяца до продакшена), нужно железо и команда, но фиксированная стоимость и полная независимость. Граница окупаемости self-hosting — около 50-100 млн токенов в месяц при стабильной нагрузке. Меньше — берите API.
Нужна ли ИТ-аккредитация, чтобы использовать AI?
Нет, ИТ-аккредитация — это про налоговые льготы и отсрочки от армии для ИТ-компаний, к использованию AI отношения не имеет. Но если вы планируете внедрять AI как продукт и продавать другим компаниям — аккредитация даст бонусы по налогу на прибыль (3% вместо 20% до 2030 года) и НДС-льготы для своих ПО-продуктов. Подача — через Минцифры РФ онлайн, занимает 5-10 рабочих дней.
Выводы и рекомендации по сценариям
Российский AI-стек в 2026 — уже не «времянка», а зрелая альтернатива западному. Не так круто как GPT-4o + Claude Sonnet 4 в идеальном мире, но достаточно для 90% бизнес-задач, и единственно легальный путь для работы с ПД клиентов в РФ.
Мои рекомендации по сценариям:
- Стартап с MVP, бюджет до 50 тыс ₽/мес на AI: GigaChat 3 Lite или Pro, через Python SDK. Старт за 1 день.
- SaaS со 100K+ пользователей: YandexGPT 5 Pro или GigaChat 3 Max. Сервисный SLA, корпоративные тарифы со скидкой, маршрутизация Lite/Pro по сложности задач.
- RAG-система с большой базой документов: GigaChat 3 Max за контекст 128K + Qdrant как векторная БД на VK Cloud / Yandex Cloud.
- Финтех, банковское приложение: T-Pro (специализация на финансах) или Cotype Pro (корпоративная инфраструктура), self-hosting или enterprise-контракт.
- Чат-бот для сайта простого бизнеса: YandexGPT 5 Lite + Telegram-Bot-Api или прямая интеграция с сайтом, бюджет от 5 тыс ₽/мес. Закажите AI-ассистента на сайт — сделаю под ключ.
- Полная локальность, корпоративная безопасность: self-hosted Qwen 2.5 72B или Llama 3.3 70B на собственном/арендованном железе в РФ.
- Генерация изображений для маркетинга: Kandinsky 4 (дешевле, open) или YandexART 2 (стабильнее).
Что делать прямо сейчас:
- Проверьте, что в текущей AI-инфраструктуре нет передачи ПД клиентов на западные API. Это первое, что найдёт РКН при проверке.
- Получите тестовые ключи к YandexGPT и GigaChat (бесплатные лимиты на 1М токенов/мес). Прогоните свой реальный кейс на обеих моделях, сравните качество вживую — это занимает день, экономит месяцы.
- Если уже на проде с западным AI — спланируйте миграцию. Большинство задач переезжает за 2-4 недели, основное время — на тестирование промптов под новые модели (они реагируют по-разному).
Если разбираетесь сами — отлично, инфраструктура зрелая, документация неплохая, можно справиться. Если нужна помощь с выбором модели, архитектурой RAG, миграцией с OpenAI или разработкой AI-агента под ваш кейс — пишите.
Выбираете AI для бизнеса — разберём ваш кейс
Если стоите перед выбором AI-стека или хотите внедрить чат-бот/AI-ассистента в бизнес — напишите мне в Telegram. У меня сертификаты Vanderbilt и MongoDB по AI-агентам, на счету десяток внедрений на российском стеке (YandexGPT, GigaChat, self-hosted Qwen). За 30 минут разбора бесплатно подскажу: какая модель подходит под вашу задачу, какой архитектурой собирать, сколько это будет стоить и где основные подводные камни.
Нужен профессиональный аудит 152-ФЗ?
Отчёт за 1–3 дня, устранение нарушений под ключ. От 5 000 ₽.