6 AI-провайдеров: Claude · GPT-4 · Gemini · Perplexity · DeepSeek · Grok

Единый API для всех AI моделей

Мощная middleware-платформа для интеграции AI в ваш продукт. Потоковая передача, управление инструментами, файлы — всё в одном REST API.

Начать бесплатно Смотреть документацию

AI-провайдеров

SSE

Потоковая передача

<50ms

Первый токен

∞

Инструментов

Возможности

Всё что нужно для
production AI-приложений

От потоковых ответов до управления файлами — AIST Chat предоставляет полный набор инструментов.

Потоковая передача SSE

Server-Sent Events для real-time стриминга токенов. Поддержка переподключения и отмены активного потока в любой момент.

SSE Reconnect Cancel

6 AI-провайдеров

aist-llm абстрагирует Claude, GPT-4, Gemini, Perplexity, DeepSeek и Grok. Переключайте модель через один параметр без изменения остального кода.

Claude GPT-4 Gemini DeepSeek

Инструменты и вебхуки

Подключайте внешние API как инструменты для ассистента. Поддержка асинхронных запросов, шаблонов параметров и callback-механизмов.

Tool Calls Async

Управление файлами

Загрузка и обработка документов: Word (.docx), изображения и другие форматы. Автоматическое определение MIME-типов.

Word Изображения Multipart

Режим мышления

Поддержка Thinking Profile для Claude — расширенное пошаговое рассуждение для сложных задач. Настройка температуры и max_tokens.

Thinking Temperature

История и повторы

Умное управление историей диалога. Автоматические имена чатов через GPT, механизм retry для неудачных сообщений.

Auto-name Retry History

Как работает

От запроса до ответа
за миллисекунды

Простая архитектура с чёткими зонами ответственности на каждом уровне.

Запрос клиента

Ваш frontend отправляет POST-запрос с сообщением пользователя и параметрами модели.

AIST Chat Middleware

Платформа маршрутизирует запрос, управляет историей, вызывает инструменты и стримит ответ.

Ответ в реальном времени

Клиент получает SSE-поток с токенами, вызовами инструментов и метаданными завершения.

Клиент

Любое приложение

Middleware · :1500

aist-chat

Auth relay SSE stream Tool callbacks Routing

Backend · PHP/Laravel

laravel-back

Пользователи Чаты Ассистенты Авторизация

Inference · :1235

aist-llm

LLM routing Tool calls Streaming Files

Anthropic

Claude

OpenAI

GPT-4o

Google

Gemini

Perplexity

Sonar

DeepSeek

xAI

Grok

REST API

Простая интеграция
за 5 минут

Стандартный REST API с Bearer-аутентификацией. Отправьте сообщение и получайте потоковый ответ через Server-Sent Events.

POST /chats Создать чат

POST /chats/:id/messages Отправить сообщение

GET /chats/:id/stream Подключиться к потоку

POST /chats/:id/stop Остановить поток

GET /llm-models Список моделей

example.ts
TypeScript

                        // 1. Создаём чат
const chat = await fetch('https://api.aist.chat/chats', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${TOKEN}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    name: 'Мой чат',
    assistant_id: 1
  })
}).then(r => r.json());

// 2. Отправляем сообщение со стримингом
const es = new EventSource(
  `/chats/${chat.data.id}/stream`
);

await fetch(`/chats/${chat.data.id}/messages`, {
  method: 'POST',
  body: JSON.stringify({
    stream: true,
    input: [{ type: 'text', text: 'Привет!' }]
  })
});

// 3. Читаем потоковые токены
es.addEventListener('content_delta', (e) => {
  const delta = JSON.parse(e.data);
  process.stdout.write(delta.text);
});
                    

SSE события

content_delta

tool_call_start

turn_complete

Типы контента

text

tool_call

file

Поддерживаемые модели

Лучшие AI-модели
в вашем распоряжении

Выбирайте модель под задачу — от быстрых ответов до глубокого анализа.

Anthropic

Claude 4

Reasoning, написание кода, анализ документов. Поддержка Thinking Mode для сложных задач.

Tool Calls Thinking Vision

OpenAI

GPT-4o

Мощная мультимодальная модель. Используется также для автоматической генерации имён чатов.

Tool Calls Multimodal

Google

Gemini 2

Последнее поколение Google. Длинный контекст, поиск в вебе и работа с большими документами.

Web Search Long Context

Perplexity

Sonar Pro

Поиск в реальном времени с актуальными источниками. Идеально для задач, требующих свежих данных.

Real-time Citations

DeepSeek

DeepSeek R1

Мощная reasoning-модель с открытым весами. Глубокое пошаговое рассуждение при низкой стоимости запросов.

Reasoning Open Weights

xAI

Grok

Модель от Илона Маска с доступом к данным X/Twitter в реальном времени. Быстрые ответы с актуальным контекстом.

Real-time X / Twitter

Единый API для всех AI моделей

Всё что нужно для production AI-приложений

Потоковая передача SSE

6 AI-провайдеров

Инструменты и вебхуки

Управление файлами

Режим мышления

История и повторы

От запроса до ответа за миллисекунды

Запрос клиента

AIST Chat Middleware

Ответ в реальном времени

Простая интеграция за 5 минут

Лучшие AI-модели в вашем распоряжении

Claude 4

GPT-4o

Gemini 2

Sonar Pro

DeepSeek R1

Grok

Готовы интегрировать AI в ваш продукт?

Всё что нужно для
production AI-приложений

От запроса до ответа
за миллисекунды

Простая интеграция
за 5 минут

Лучшие AI-модели
в вашем распоряжении

Готовы интегрировать
AI в ваш продукт?