Gemini 3.1 Flash Lite — оплата из России

Модальности
Цена входа48 /1M
Цена выхода288 /1M
Релиз7 мая 2026 г.
ID модели
gemini-3.1-flash-litegoogle/gemini-3.1-flash-lite

Используйте модель Gemini 3.1 Flash Lite от Google в России без VPN. Совместимость с OpenAI SDK, оплата в рублях.

Описание модели

Лёгкая и быстрая модель для масштаба и экономии

Gemini 3.1 Flash Lite — это мультимодальная языковая модель, способная обрабатывать текст, изображения, видео, файлы и документы (PDF) и аудио от GOOGLE. Модель обладает контекстным окном в 1 048 576 токенов. Максимальная длина ответа составляет 65 536 токенов.

Модель поддерживает: вызов инструментов (tool calling), режим рассуждений (reasoning), структурированные ответы (structured outputs), форматирование ответов (JSON mode). Это позволяет создавать AI-агентов, которые взаимодействуют с внешними API и сервисами.

Доступ к API Gemini 3.1 Flash Lite в России предоставляется через AITUNNEL без VPN с оплатой в рублях. API полностью совместим с OpenAI SDK — достаточно заменить base URL на api.aitunnel.ru/v1 и использовать ваш ключ AITUNNEL.

Модальности

Визуальная схема типов данных, которые модель принимает на вход и возвращает в ответе.

Вход
Текст
Изображения
Видео
Файлы / PDF
Аудио
Gemini 3.1 Flash Lite
Выход
Текст

Возможности API

Tool Calling (вызов функций)
Модель может вызывать внешние функции и API: получать данные из баз, отправлять запросы к сервисам, выполнять вычисления. Идеально для создания AI-агентов.
Reasoning (рассуждения)
Поддерживает пошаговое рассуждение ("chain of thought"), что значительно повышает качество ответов на задачи, требующие логики, математики и анализа.
Structured Outputs
Возвращает ответы в строго заданном формате JSON Schema. Гарантирует валидную структуру данных для автоматизированных пайплайнов и интеграций.
Анализ изображений (Vision)
Понимает содержимое изображений: распознаёт объекты, читает текст (OCR), анализирует графики, схемы и скриншоты.
Работа с файлами (PDF, документы)
Принимает файлы напрямую: PDF-документы, таблицы, текстовые файлы. Извлекает, анализирует и суммирует информацию из загруженных документов.
Обработка аудио
Принимает аудиофайлы на вход: распознаёт речь, анализирует звуковой контент, отвечает на вопросы по аудиозаписям.
Анализ видео
Понимает видеоконтент: анализирует сцены, распознаёт действия, извлекает информацию из видеороликов.
Аудио ввод/вывод
Поддерживает голосовой ввод и генерацию аудио-ответов. Позволяет создавать голосовых ассистентов.

Какая модель мне подходит?

Подберите модель под вашу задачу — от программирования и AI-агентов до анализа документов и креативного письма. Оценим Gemini 3.1 Flash Lite по вашим критериям и предложим альтернативы из всего каталога AITUNNEL.

Шаг 1 из 5

Чем вы будете заниматься?

Выберите главную задачу — это сильнее всего влияет на результат

Стоимость Gemini 3.1 Flash Lite API — цены и оплата в России

Цены указаны за 1 миллион токенов — это как 15 русских книг. Тарифы пересматриваются каждый месяц — гарантируем самую низкую цену в России.

Текстовые токены

Ввод48за 1M токенов
Вывод288за 1M токенов
Reasoning288за 1M токенов

Кеширование

Чтение кеша4.8за 1M токенов
Запись в кеш16за 1M токенов

Аудио

Аудио ввод96за 1M аудио токенов
Аудио вывод96за 1M аудио токенов

Дополнительно

Веб-поиск2.69за запрос
Изображение0за изображение

Лимиты

Контекст1 048 576токенов
Макс. вывод65 536токенов

Калькулятор стоимости API

Выберите модель, укажите объём запросов и сразу увидите ориентировочную стоимость в рублях. Удобно для оценки бюджета перед покупкой и интеграцией API.

Загрузка...

Стоимость типовых задач

Примерная стоимость использования Gemini 3.1 Flash Lite для распространённых задач (рассчитано на основе актуальных цен AITUNNEL):

Анализ документа (50 стр.)
~1.54 ₽
~20K токенов ввод + ~2K вывод
100 сообщений в чат-боте
~9.36 ₽
~150 токенов вопрос + ~300 токенов ответ
Написание статьи (3000 слов)
~1.18 ₽
~500 токенов промпт + ~4K вывод
Перевод текста (10 страниц)
~1.49 ₽
~4K токенов ввод + ~4.5K вывод

Бенчмарки Gemini 3.1 Flash Lite

Независимые оценки качества, скорости и задержки от Artificial Analysis.

25
Artificial Analysis
Индекс интеллекта
Лучше, чем 25% моделей
35
Artificial Analysis
Индекс кодинга
Лучше, чем 35% моделей
Рассуждения
GPQA DiamondНаучные рассуждения уровня аспиранта
82.2%
HLEСложнейший экзамен для человечества
16.2%
Программирование
SciCodePython для научных вычислений
41.9%
Производительность
Скорость выводаМедианное количество токенов в секунду
350 т/с
Время до первого токенаМедианная задержка до начала ответа
4.7с

Подключение Gemini 3.1 Flash Lite API из России без VPN

API Gemini 3.1 Flash Lite совместим с OpenAI SDK — достаточно поменять base_url на адрес AITUNNEL. Меняется только название модели, подробнее в документации. Если вы не знакомы с программированием, воспользуйтесь встроенным чатом в панели, который позволяет быстро переключаться между различными моделями.

1Получите API-ключ

Зарегистрируйтесь, пополните баланс от 399₽ и создайте ключ в панели — он работает сразу для всех моделей.

2Первый запрос

Укажите модель gemini-3.1-flash-lite и базовый URL https://api.aitunnel.ru/v1/ — всё остальное как в обычном OpenAI SDK.

from openai import OpenAI

client = OpenAI(
    api_key="ваш_ключ_aitunnel",
    base_url="https://api.aitunnel.ru/v1/"
)

response = client.chat.completions.create(
    model="gemini-3.1-flash-lite",
    messages=[
        {"role": "user", "content": "Привет! Как дела?"}
    ]
)

print(response.choices[0].message.content)

3Или подключите к приложениям

Укажите наш Base URL и ваш ключ в любом приложении с поддержкой OpenAI API (Cursor, Cline, n8n и др.).

Настройки · OpenAI API
https://api.aitunnel.ru/v1
sk-aitunnel-•••••••••••••••••••Verify
gemini-3.1-flash-lite
Соединение установлено
Интегрируйте Gemini 3.1 Flash Lite в ваши инструменты
Cursor, Claude Code, n8n, LangChain, Telegram-боты и другие — API совместим с OpenAI SDK, смена занимает минуту.
Все интеграции

Частые вопросы

Сколько стоит Gemini 3.1 Flash Lite API?

Стоимость использования Gemini 3.1 Flash Lite через AITUNNEL: ввод (input) — 48 ₽ за 1 миллион токенов, вывод (output) — 288 ₽ за 1 миллион токенов. Оплата в рублях, минимальное пополнение от 399 ₽.

Какой контекст у Gemini 3.1 Flash Lite?

Контекстное окно Gemini 3.1 Flash Lite составляет 1 048 576 токенов — это примерно 2 621 страниц текста. Это один из самых больших контекстов на рынке, позволяющий анализировать целые книги и крупные кодовые базы за один запрос.

Что умеет Gemini 3.1 Flash Lite?

Gemini 3.1 Flash Lite поддерживает: вызов инструментов (tool calling), режим рассуждений (reasoning), структурированные ответы (structured outputs), форматирование ответов (JSON mode), анализ изображений, обработку аудио, анализ видео, работу с файлами и PDF. Модель разработана компанией GOOGLE и доступна в России через AITUNNEL без VPN.

Как подключить Gemini 3.1 Flash Lite в России без VPN?

Для использования Gemini 3.1 Flash Lite в России без VPN: 1) Зарегистрируйтесь на aitunnel.ru и получите API-ключ. 2) Пополните баланс от 399 ₽. 3) В вашем коде замените base URL на https://api.aitunnel.ru/v1/ и укажите ваш ключ AITUNNEL. API полностью совместим с OpenAI SDK — достаточно изменить две строки кода.

Gemini 3.1 Flash Lite или gemini-3.5-flash — что выбрать?

Сравнивая Gemini 3.1 Flash Lite и gemini-3.5-flash: Gemini 3.1 Flash Lite дешевле при сопоставимом качестве. По контексту: обе модели имеют одинаковый размер контекста. Выбор зависит от задачи — протестируйте обе модели через AITUNNEL, чтобы определить оптимальный вариант для вашего проекта.

Поддерживает ли Gemini 3.1 Flash Lite работу с изображениями?

Да, Gemini 3.1 Flash Lite — мультимодальная модель, которая принимает изображения на вход. Вы можете отправлять фотографии, скриншоты, графики и другие изображения вместе с текстовым запросом. Модель распознает содержимое изображений, читает текст (OCR) и отвечает на вопросы о визуальном контенте. Для отправки изображения добавьте элемент с типом image_url в массив content сообщения.

Поддерживает ли Gemini 3.1 Flash Lite аудио на входе?

Да, Gemini 3.1 Flash Lite принимает аудиофайлы на вход. Вы можете отправлять аудиозаписи для транскрибации, анализа содержимого и ответов на вопросы по аудио. Для отправки аудио используйте элемент с типом input_audio в массиве content. Аудио передаётся в формате base64. Поддерживаемые форматы: mp3, wav, webm.

Поддерживает ли Gemini 3.1 Flash Lite анализ видео?

Да, Gemini 3.1 Flash Lite умеет анализировать видеоконтент. Вы можете отправлять видеофайлы для описания сцен, распознавания действий и ответов на вопросы по видео. Видео передаётся через элемент `video_url` в массиве `content` — либо как публичная ссылка (URL), либо как base64 data URL для локальных файлов.

Поддерживает ли Gemini 3.1 Flash Lite работу с PDF и файлами?

Да, Gemini 3.1 Flash Lite принимает файлы и документы (PDF) на вход. Вы можете загрузить PDF-документ, таблицу или текстовый файл, и модель извлечёт, проанализирует и суммирует информацию. Это удобно для анализа контрактов, отчётов, научных статей и другой документации.

Поддерживает ли Gemini 3.1 Flash Lite tool calling (вызов функций)?

Да, Gemini 3.1 Flash Lite поддерживает tool calling (function calling). Вы можете определить набор функций через параметр tools, и модель будет вызывать их для получения данных или выполнения действий. Это ключевая функция для создания AI-агентов, чат-ботов с доступом к базам данных и автоматизации бизнес-процессов. Используйте tool_choice для управления поведением: auto (модель решает сама), required (обязательный вызов) или none (без вызовов).

Поддерживает ли Gemini 3.1 Flash Lite Structured Outputs?

Да, Gemini 3.1 Flash Lite поддерживает Structured Outputs — ответы, строго соответствующие заданной JSON Schema. Передайте response_format с типом json_schema и описанием схемы. В Python SDK можно использовать Pydantic-модели с методом client.beta.chat.completions.parse(). Это надёжнее обычного JSON Mode и гарантирует валидную структуру данных.

Поддерживает ли Gemini 3.1 Flash Lite режим рассуждений (reasoning)?

Да, Gemini 3.1 Flash Lite поддерживает режим рассуждений (reasoning / chain of thought). Модель выполняет пошаговое логическое мышление перед формированием ответа, что значительно повышает качество на задачах, требующих логики, математики и сложного анализа. Управляйте глубиной мышления через параметр reasoning_effort (low, medium, high).

Какие модальности поддерживает Gemini 3.1 Flash Lite?

Gemini 3.1 Flash Lite принимает на вход: текст, изображения, аудио, видео, файлы (PDF). Генерирует на выходе: текст. Это делает Gemini 3.1 Flash Lite мультимодальной моделью, способной работать с различными типами данных в одном запросе.

Поддерживает ли Gemini 3.1 Flash Lite русский язык?

Gemini 3.1 Flash Lite поддерживает работу с русским языком — как на вход, так и на выход. Качество работы с русским языком зависит от конкретной модели и задачи. Через AITUNNEL вы получаете полноценный доступ к Gemini 3.1 Flash Lite из России без VPN с оплатой в рублях.

Используйте эту модель через AITUNNEL

Получите доступ к этой и 50+ другим AI моделям через единый API. Работает из России без VPN, оплата в рублях.

OpenAI-совместимый APIОплата картой РФБыстрый старт
Начать работуРегистрация за 1 минуту
Чат