6 AI-провайдеров: Claude · GPT-4 · Gemini · Perplexity · DeepSeek · Grok

Единый API для всех AI моделей

Мощная middleware-платформа для интеграции AI в ваш продукт. Потоковая передача, управление инструментами, файлы — всё в одном REST API.

6
AI-провайдеров
SSE
Потоковая передача
<50ms
Первый токен
Инструментов

AI-провайдеры в aist-llm

A Anthropic Claude
OpenAI GPT-4o
Google Gemini
Perplexity Sonar
DeepSeek R1
xAI Grok

Всё что нужно для
production AI-приложений

От потоковых ответов до управления файлами — AIST Chat предоставляет полный набор инструментов.

Потоковая передача SSE

Server-Sent Events для real-time стриминга токенов. Поддержка переподключения и отмены активного потока в любой момент.

SSE Reconnect Cancel

6 AI-провайдеров

aist-llm абстрагирует Claude, GPT-4, Gemini, Perplexity, DeepSeek и Grok. Переключайте модель через один параметр без изменения остального кода.

Claude GPT-4 Gemini DeepSeek

Инструменты и вебхуки

Подключайте внешние API как инструменты для ассистента. Поддержка асинхронных запросов, шаблонов параметров и callback-механизмов.

Tool Calls Async

Управление файлами

Загрузка и обработка документов: Word (.docx), изображения и другие форматы. Автоматическое определение MIME-типов.

Word Изображения Multipart

Режим мышления

Поддержка Thinking Profile для Claude — расширенное пошаговое рассуждение для сложных задач. Настройка температуры и max_tokens.

Thinking Temperature

История и повторы

Умное управление историей диалога. Автоматические имена чатов через GPT, механизм retry для неудачных сообщений.

Auto-name Retry History

От запроса до ответа
за миллисекунды

Простая архитектура с чёткими зонами ответственности на каждом уровне.

1

Запрос клиента

Ваш frontend отправляет POST-запрос с сообщением пользователя и параметрами модели.

2

AIST Chat Middleware

Платформа маршрутизирует запрос, управляет историей, вызывает инструменты и стримит ответ.

3

Ответ в реальном времени

Клиент получает SSE-поток с токенами, вызовами инструментов и метаданными завершения.

Клиент
Любое приложение
Middleware · :1500
aist-chat
Auth relay SSE stream Tool callbacks Routing
Backend · PHP/Laravel
laravel-back
Пользователи Чаты Ассистенты Авторизация
Inference · :1235
aist-llm
LLM routing Tool calls Streaming Files
Anthropic
Claude
OpenAI
GPT-4o
Google
Gemini
Perplexity
Sonar
DeepSeek
R1
xAI
Grok

Простая интеграция
за 5 минут

Стандартный REST API с Bearer-аутентификацией. Отправьте сообщение и получайте потоковый ответ через Server-Sent Events.

POST /chats Создать чат
POST /chats/:id/messages Отправить сообщение
GET /chats/:id/stream Подключиться к потоку
POST /chats/:id/stop Остановить поток
GET /llm-models Список моделей
example.ts
TypeScript
// 1. Создаём чат
const chat = await fetch('https://api.aist.chat/chats', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${TOKEN}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    name: 'Мой чат',
    assistant_id: 1
  })
}).then(r => r.json());

// 2. Отправляем сообщение со стримингом
const es = new EventSource(
  `/chats/${chat.data.id}/stream`
);

await fetch(`/chats/${chat.data.id}/messages`, {
  method: 'POST',
  body: JSON.stringify({
    stream: true,
    input: [{ type: 'text', text: 'Привет!' }]
  })
});

// 3. Читаем потоковые токены
es.addEventListener('content_delta', (e) => {
  const delta = JSON.parse(e.data);
  process.stdout.write(delta.text);
});
SSE события
content_delta
tool_call_start
turn_complete
Типы контента
text
tool_call
file

Лучшие AI-модели
в вашем распоряжении

Выбирайте модель под задачу — от быстрых ответов до глубокого анализа.

Anthropic

Claude 4

Reasoning, написание кода, анализ документов. Поддержка Thinking Mode для сложных задач.

Tool Calls Thinking Vision
OpenAI

GPT-4o

Мощная мультимодальная модель. Используется также для автоматической генерации имён чатов.

Tool Calls Multimodal
Google

Gemini 2

Последнее поколение Google. Длинный контекст, поиск в вебе и работа с большими документами.

Web Search Long Context
Perplexity

Sonar Pro

Поиск в реальном времени с актуальными источниками. Идеально для задач, требующих свежих данных.

Real-time Citations
DeepSeek

DeepSeek R1

Мощная reasoning-модель с открытым весами. Глубокое пошаговое рассуждение при низкой стоимости запросов.

Reasoning Open Weights
xAI

Grok

Модель от Илона Маска с доступом к данным X/Twitter в реальном времени. Быстрые ответы с актуальным контекстом.

Real-time X / Twitter

Готовы интегрировать
AI в ваш продукт?

AIST Chat берёт на себя всю сложность работы с LLM — вам остаётся только создавать продукт.