glm-4.5-air
z-aiКонтекст131 072 токенов
Вход24.96 ₽/1M
Выход163.20 ₽/1M
Ответ
Скорость ответа glm-4.5-air зависит от нескольких факторов: размера запроса, параметра max_tokens, загруженности серверов z-ai. В среднем первый токен приходит за 0.5–2 секунды, полный ответ на короткий запрос — за 2–10 секунд. Через AITUNNEL поддерживается streaming для получения ответа по частям в реальном времени.
Быстрый старт с glm-4.5-air
Пример вызова glm-4.5-air через AITUNNEL API:
from openai import OpenAI
client = OpenAI(
api_key="ваш_ключ_aitunnel",
base_url="https://api.aitunnel.ru/v1/"
)
response = client.chat.completions.create(
model="glm-4.5-air",
messages=[
{"role": "user", "content": "Привет! Как дела?"}
]
)
print(response.choices[0].message.content)Другие вопросы о glm-4.5-air
Этот же вопрос — другие модели
Попробуйте сами через AITUNNEL
Получите API ключ и протестируйте модели. Работает из России без VPN, оплата в рублях.
Быстрый стартОплата картой РФПоддержка
Начать работуРегистрация за 1 минуту