Поддерживает ли gpt-4o-mini-audio-preview аудио на входе?

Question

Accepted Answer

Поддержка аудио на входе зависит от конкретной версии gpt-4o-mini-audio-preview. Некоторые модели принимают аудиофайлы напрямую в запросе — распознают речь, анализируют звуковой контент и отвечают на вопросы по аудиозаписям.

Модели с поддержкой аудио на входе через AITUNNEL: GPT-4o Audio, Gemini 2.5 Pro, Gemini 2.5 Flash и другие мультимодальные модели. Для отправки аудио используйте элемент с типом `input_audio` в массиве content сообщения. Аудио передаётся в формате base64.

Если gpt-4o-mini-audio-preview не поддерживает аудио напрямую, используйте модели распознавания речи (Whisper) для транскрибации, а затем отправьте текст в gpt-4o-mini-audio-preview. Проверьте поддерживаемые модальности на странице модели в каталоге AITUNNEL.

Поддерживает ли gpt-4o-mini-audio-preview аудио на входе?

gpt-4o-mini-audio-preview

Ответ

Пример отправки аудио в gpt-4o-mini-audio-preview

Другие вопросы о gpt-4o-mini-audio-preview

Этот же вопрос — другие модели

Попробуйте сами через AITUNNEL