gpt-4o-mini-audio-preview
openaiОтвет
Поддержка аудио на входе зависит от конкретной версии gpt-4o-mini-audio-preview. Некоторые модели принимают аудиофайлы напрямую в запросе — распознают речь, анализируют звуковой контент и отвечают на вопросы по аудиозаписям.
Модели с поддержкой аудио на входе через AITUNNEL: GPT-4o Audio, Gemini 2.5 Pro, Gemini 2.5 Flash и другие мультимодальные модели. Для отправки аудио используйте элемент с типом input_audio в массиве content сообщения. Аудио передаётся в формате base64.
Если gpt-4o-mini-audio-preview не поддерживает аудио напрямую, используйте модели распознавания речи (Whisper) для транскрибации, а затем отправьте текст в gpt-4o-mini-audio-preview. Проверьте поддерживаемые модальности на странице модели в каталоге AITUNNEL.
Пример отправки аудио в gpt-4o-mini-audio-preview
Отправьте аудиофайл в формате base64 для анализа в gpt-4o-mini-audio-preview через AITUNNEL API:
import base64
from openai import OpenAI
client = OpenAI(
api_key="ваш_ключ_aitunnel",
base_url="https://api.aitunnel.ru/v1/"
)
# Читаем аудиофайл и кодируем в base64
with open("audio.mp3", "rb") as f:
audio_base64 = base64.b64encode(f.read()).decode("utf-8")
response = client.chat.completions.create(
model="gpt-4o-mini-audio-preview",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": "Транскрибируй это аудио"},
{
"type": "input_audio",
"input_audio": {
"data": audio_base64,
"format": "mp3"
}
}
]
}
]
)
print(response.choices[0].message.content)Другие вопросы о gpt-4o-mini-audio-preview
Этот же вопрос — другие модели
Попробуйте сами через AITUNNEL
Получите API ключ и протестируйте модели. Работает из России без VPN, оплата в рублях.