gemini-2.5-flash-lite
googleКонтекст1 048 576 токенов
Вход19.20 ₽/1M
Выход76.80 ₽/1M
Ответ
Способы снизить расходы на gemini-2.5-flash-lite:
- Оптимизируйте промпты — короче вход = меньше токенов.
- Ограничьте max_tokens для ответа.
- Используйте кеширование повторяющихся запросов.
- Для простых задач выбирайте более дешёвые модели (GPT-5-mini, Claude Haiku).
- Сжимайте историю диалога. Через AITUNNEL вы видите расход токенов в личном кабинете.
Быстрый старт с gemini-2.5-flash-lite
Пример вызова gemini-2.5-flash-lite через AITUNNEL API:
from openai import OpenAI
client = OpenAI(
api_key="ваш_ключ_aitunnel",
base_url="https://api.aitunnel.ru/v1/"
)
response = client.chat.completions.create(
model="gemini-2.5-flash-lite",
messages=[
{"role": "user", "content": "Привет! Как дела?"}
]
)
print(response.choices[0].message.content)Другие вопросы о gemini-2.5-flash-lite
Этот же вопрос — другие модели
Попробуйте сами через AITUNNEL
Получите API ключ и протестируйте модели. Работает из России без VPN, оплата в рублях.
Быстрый стартОплата картой РФПоддержка
Начать работуРегистрация за 1 минуту