FAQ • gpt-4o-mini-audio-preview

Какие модальности поддерживает gpt-4o-mini-audio-preview?

Подробный ответ на вопрос о gpt-4o-mini-audio-preview через AITUNNEL API

gpt-4o-mini-audio-preview

openai
Контекст128 000 токенов
Вход28.80 ₽/1M
Выход115.20 ₽/1M

Ответ

Модальности gpt-4o-mini-audio-preview определяют, какие типы данных модель принимает на вход и генерирует на выходе. Основные модальности:

Входные модальности (что принимает):

  • Текст — все модели поддерживают текстовый ввод
  • Изображения — мультимодальные модели (GPT-5, Claude, Gemini) анализируют картинки
  • Аудио — некоторые модели (GPT-4o Audio, Gemini) принимают аудиофайлы
  • Видео — Gemini 2.5 Pro/Flash анализируют видеоролики
  • Файлы (PDF) — Claude, Gemini работают с документами напрямую

Выходные модальности (что генерирует):

  • Текст — все модели генерируют текст
  • Изображения — GPT-5 (с modalities: ["image", "text"]) генерирует картинки в диалоге

Конкретные модальности gpt-4o-mini-audio-preview можно проверить на странице модели в каталоге AITUNNEL — они отображаются в секции «Модальности».

Быстрый старт с gpt-4o-mini-audio-preview

Пример вызова gpt-4o-mini-audio-preview через AITUNNEL API:

from openai import OpenAI

client = OpenAI(
    api_key="ваш_ключ_aitunnel",
    base_url="https://api.aitunnel.ru/v1/"
)

response = client.chat.completions.create(
    model="gpt-4o-mini-audio-preview",
    messages=[
        {"role": "user", "content": "Привет! Как дела?"}
    ]
)

print(response.choices[0].message.content)

Другие вопросы о gpt-4o-mini-audio-preview

Этот же вопрос — другие модели

Попробуйте сами через AITUNNEL

Получите API ключ и протестируйте модели. Работает из России без VPN, оплата в рублях.

Быстрый стартОплата картой РФПоддержка
Начать работуРегистрация за 1 минуту