Перейти к содержанию

Мультиагентность и оркестрация AI-провайдеров

Система поддерживает одновременное подключение нескольких AI-провайдеров. Администратор выбирает, какой провайдер обрабатывает какие задачи. Провайдеры переключаются без деплоя — через UI.

Управление провайдерами (UI администратора)

Администратор видит дашборд подключённых провайдеров:

Провайдер Тип Модель Статус Назначение
OpenAI Облачный API GPT-4.1 Активен Основной: ответы клиентам
OpenAI Облачный API GPT-4o-mini Активен Классификация, тональность
Claude Облачный API Claude Sonnet Резерв Fallback при недоступности OpenAI
YandexGPT Облачный API YandexGPT Pro Резерв Fallback #2
Ollama Self-hosted Llama 3 Неактивен Тестирование
Rule Engine Встроенный Активен Простые FAQ без LLM

Для каждого провайдера администратор настраивает:

  • API-ключ (шифруется, отображается как маска)
  • Endpoint URL
  • Модель
  • Параметры генерации (temperature, max_tokens и т.д.)
  • Приоритет (для fallback)
  • Статус (активен / резерв / неактивен)
  • Тест подключения одной кнопкой

Оркестрация: разные провайдеры для разных задач

Не все задачи требуют одной и той же модели. Тяжёлая модель для ответа клиенту, лёгкая — для классификации. Администратор назначает провайдера на каждый тип задачи:

Тип задачи Что делает Требования Рекомендуемая модель
Ответ клиенту RAG + генерация ответа Качество, понимание контекста Тяжёлая (GPT-4.1, Claude Sonnet)
Классификация Определение категории и подкатегории обращения Скорость, точность Лёгкая (GPT-4o-mini)
Определение тональности Негатив, нейтрал, позитив в сообщении клиента Скорость Лёгкая (GPT-4o-mini)
Оценка качества ответа Семантический классификатор: адекватен ли ответ AI Точность Средняя (GPT-4o)
Генерация embeddings Векторное представление для RAG-поиска Совместимость с KB Embedding-модель (Ada v2)
Простые FAQ Ответы на частые вопросы по правилам Скорость, стоимость Rule Engine (без LLM)

Настраивается в админке: для каждого типа задачи — выпадающий список провайдеров. Можно назначить один провайдер на все задачи, а можно распределить.

Fallback-цепочка

Для каждого типа задачи — своя цепочка fallback:

Ответ клиенту:   GPT-4.1 → Claude Sonnet → YandexGPT → Rule Engine
Классификация:   GPT-4o-mini → GPT-4.1 → Rule Engine
Embeddings:      Ada v2 (единственный, без fallback)

Если основной провайдер недоступен — автопереключение на следующий в цепочке через 5 секунд. Без участия человека.

Добавление нового провайдера

Система поддерживает подключение любого LLM через совместимый API:

  • Облачные: OpenAI, Claude (Anthropic), Gemini (Google), YandexGPT — через API-ключ
  • Self-hosted: Ollama, vLLM, LocalAI — через URL локального сервера
  • Кастомный: любой сервис с OpenAI-совместимым API

Подключение нового провайдера: заполнить форму в админке (тип, URL, ключ, модель) → нажать "Тест подключения" → назначить на задачу.

Мониторинг провайдеров

Администратор и менеджер видят в дашборде:

  • Статус каждого провайдера (доступен / недоступен / деградация)
  • Время ответа (средняя латентность за период)
  • Количество вызовов по каждому провайдеру
  • Количество ошибок и таймаутов
  • История переключений fallback (когда, почему, на какой провайдер)