Распознавание речи API

Преобразуйте речь в текст. Whisper, GPT-4o Transcribe, Voxtral, Qwen3-ASR, Chirp 3 — всё в одном API

AITUNNEL предоставляет единый API распознавания речи (Speech-to-Text) с доступом к лучшим моделям индустрии: OpenAI Whisper, GPT-4o Transcribe, Mistral Voxtral, Qwen3-ASR Flash и Google Chirp 3. Один эндпоинт, оплата в рублях, без VPN.

Доступные модели:

  • whisper-1 — классическая модель OpenAI, ~50 языков, поддержка перевода
  • whisper-large-v3 — open-source Whisper Large V3, 99+ языков, дешевле в разы
  • whisper-large-v3-turbo — ускоренная версия Whisper Large V3
  • gpt-4o-transcribe — высокоточная модель OpenAI на базе GPT-4o (per-token billing)
  • gpt-4o-mini-transcribe — экономичная версия GPT-4o Transcribe
  • gpt-4o-transcribe-diarize — с автоматическим определением говорящих (diarization)
  • voxtral-mini-transcribe — Mistral Voxtral Mini, оптимизирована для европейских языков
  • qwen3-asr-flash — Qwen3 ASR Flash от Alibaba, лидер по цене
  • chirp-3 — Google Chirp 3, 100+ языков и диалектов

Возможности:

  • Транскрипция аудио в текст (WAV, MP3, FLAC, M4A, OGG, WebM, AAC и др.)
  • Поддержка до 99+ языков с автоопределением
  • Высокая точность на русском языке
  • Diarization — разделение по спикерам (gpt-4o-transcribe-diarize)
  • Перевод на английский (Whisper-семейство)
  • Подсказка языка через параметр language (ISO-639-1)
  • Прозрачная стоимость в рублях за каждый запрос

Применение:

  • Создание субтитров к видео и подкастам
  • Транскрипция интервью, совещаний и созвонов
  • Голосовые помощники и voice-to-text в продуктах
  • Протоколирование и поиск по аудиоархивам
  • Анализ колл-центров и контроль качества звонков

Как начать

  1. Зарегистрируйтесь — создайте аккаунт на AITUNNEL за 1 минуту
  2. Пополните баланс — минимальная сумма 399₽, оплата картой или по счёту
  3. Получите API ключ — в личном кабинете создайте ключ для доступа к API
  4. Интегрируйте — используйте стандартный OpenAI SDK с нашим базовым URL

Реализуйте это с AITUNNEL

Подключите AI API для решения ваших задач. GPT-5, Claude, Gemini и другие модели через единый интерфейс.

OpenAI-совместимый APIДокументацияПоддержка 24/7
Начать работуРегистрация за 1 минуту