gpt-4o-mini-audio-preview
openaiКонтекст128 000 токенов
Вход28.80 ₽/1M
Выход115.20 ₽/1M
Ответ
Поддержка видео зависит от конкретной версии gpt-4o-mini-audio-preview. Некоторые мультимодальные модели могут анализировать видеоконтент — распознавать сцены, описывать действия и отвечать на вопросы по видеороликам.
Модели с поддержкой видео на входе через AITUNNEL: Gemini 2.5 Pro, Gemini 2.5 Flash и другие. Видео передаётся в формате base64 или по URL.
Если gpt-4o-mini-audio-preview не поддерживает видео напрямую, можно:
- Извлечь ключевые кадры и отправить их как изображения.
- Извлечь аудиодорожку и транскрибировать через Whisper.
- Использовать модели генерации видео (Sora, Kling) для создания видео по описанию.
Пример анализа видео с gpt-4o-mini-audio-preview
Отправьте видео для анализа в gpt-4o-mini-audio-preview через AITUNNEL API (поддерживается в Gemini и других мультимодальных моделях):
import base64
from openai import OpenAI
client = OpenAI(
api_key="ваш_ключ_aitunnel",
base_url="https://api.aitunnel.ru/v1/"
)
# Читаем видеофайл и кодируем в base64
with open("video.mp4", "rb") as f:
video_base64 = base64.b64encode(f.read()).decode("utf-8")
response = client.chat.completions.create(
model="gpt-4o-mini-audio-preview",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": "Опиши что происходит на видео"},
{
"type": "image_url",
"image_url": {
"url": f"data:video/mp4;base64,{video_base64}"
}
}
]
}
]
)
print(response.choices[0].message.content)Другие вопросы о gpt-4o-mini-audio-preview
Этот же вопрос — другие модели
Попробуйте сами через AITUNNEL
Получите API ключ и протестируйте модели. Работает из России без VPN, оплата в рублях.
Быстрый стартОплата картой РФПоддержка
Начать работуРегистрация за 1 минуту