FAQ

Какие модели принимают аудио на входе?

Ответ

Через AITUNNEL доступны следующие модели с поддержкой аудио на входе (Audio Input) (12 моделей):

openai: GPT Audio, GPT Audio Mini

google: Gemini 3.5 Flash, Gemini 3.1 Flash Lite, Gemini 3.1 Flash Lite Preview, Gemini 3.1 Pro Preview, Gemini 3.1 Pro Preview Customtools, Gemini 3 Flash Preview, Gemini 2.5 Flash Lite, Gemini 2.5 Flash, Gemini 2.5 Pro

xiaomi: MiMo V2.5

Для отправки аудио используйте элемент с типом input_audio в массиве content. Аудио передаётся в формате base64 (mp3, wav, webm). Модели распознают речь, анализируют звуковой контент и отвечают на вопросы по аудиозаписям.

Все модели доступны через единый API ключ AITUNNEL. Список обновляется автоматически — актуальные данные всегда на странице моделей.

Пример отправки аудио через AITUNNEL API

Отправьте аудиофайл в модель с поддержкой аудио:

import base64
from openai import OpenAI

client = OpenAI(
    api_key="ваш_ключ_aitunnel",
    base_url="https://api.aitunnel.ru/v1/"
)

# Читаем аудиофайл и кодируем в base64
with open("audio.mp3", "rb") as f:
    audio_base64 = base64.b64encode(f.read()).decode("utf-8")

response = client.chat.completions.create(
    model="gemini-2.5-pro-preview-06-05",  # или gemini-2.5-pro, gpt-4o-audio и др.
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "Транскрибируй это аудио"},
                {
                    "type": "input_audio",
                    "input_audio": {
                        "data": audio_base64,
                        "format": "mp3"
                    }
                }
            ]
        }
    ]
)

print(response.choices[0].message.content)

Какие модели принимают аудио на входе?

Ответ

Пример отправки аудио через AITUNNEL API

Похожие вопросы

Попробуйте сами через AITUNNEL