FAQ • llama-4-maverick

Поддерживает ли llama-4-maverick streaming?

Подробный ответ на вопрос о llama-4-maverick через AITUNNEL API

llama-4-maverick

meta-llama
Контекст1 048 576 токенов
Вход38.40 ₽/1M
Выход115.20 ₽/1M

Ответ

Да, llama-4-maverick поддерживает streaming.

Добавьте параметр stream: true в запрос, и ответ будет приходить по частям в реальном времени — токен за токеном.

Это улучшает UX в чат-ботах и интерфейсах, где важно показывать ответ сразу, не дожидаясь полной генерации. Streaming поддерживают все chat-модели через AITUNNEL.

Пример кода — ниже на странице.

Пример Streaming с llama-4-maverick

Получайте ответ llama-4-maverick по частям в реальном времени:

from openai import OpenAI

client = OpenAI(
    api_key="ваш_ключ_aitunnel",
    base_url="https://api.aitunnel.ru/v1/"
)

stream = client.chat.completions.create(
    model="llama-4-maverick",
    messages=[
        {"role": "user", "content": "Напиши короткий рассказ"}
    ],
    stream=True
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="", flush=True)

print()  # Новая строка в конце

Другие вопросы о llama-4-maverick

Этот же вопрос — другие модели

Попробуйте сами через AITUNNEL

Получите API ключ и протестируйте модели. Работает из России без VPN, оплата в рублях.

Быстрый стартОплата картой РФПоддержка
Начать работуРегистрация за 1 минуту