Поддерживает ли gpt-4o-mini-audio-preview анализ видео?

Question

Accepted Answer

Поддержка видео зависит от конкретной версии gpt-4o-mini-audio-preview. Некоторые мультимодальные модели могут анализировать видеоконтент — распознавать сцены, описывать действия и отвечать на вопросы по видеороликам.

Модели с поддержкой видео на входе через AITUNNEL: Gemini 2.5 Pro, Gemini 2.5 Flash и другие. Видео передаётся в формате base64 или по URL.

Если gpt-4o-mini-audio-preview не поддерживает видео напрямую, можно: 1) Извлечь ключевые кадры и отправить их как изображения. 2) Извлечь аудиодорожку и транскрибировать через Whisper. 3) Использовать модели генерации видео (Sora, Kling) для создания видео по описанию.

Поддерживает ли gpt-4o-mini-audio-preview анализ видео?

gpt-4o-mini-audio-preview

Ответ

Пример анализа видео с gpt-4o-mini-audio-preview

Другие вопросы о gpt-4o-mini-audio-preview

Этот же вопрос — другие модели

Попробуйте сами через AITUNNEL