Vision API (анализ изображений)

Анализируйте изображения с помощью AI Vision моделей

Vision API позволяет AI анализировать и понимать изображения — от простого описания до сложного анализа.

Возможности Vision API

Описание содержимого изображений
Извлечение текста (OCR)
Анализ документов и скриншотов
Ответы на вопросы по изображению
Сравнение изображений

Пример использования

python

import base64
from openai import OpenAI

client = OpenAI(
    api_key="sk-aitunnel-xxx",
    base_url="https://api.aitunnel.ru/v1/"
)

# Загрузка изображения
with open("image.jpg", "rb") as f:
    image_data = base64.b64encode(f.read()).decode()

response = client.chat.completions.create(
    model="gpt-5.2",  # или gemini-2.5-flash, claude-sonnet-4.5
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "Что изображено на картинке?"},
            {
                "type": "image_url",
                "image_url": {
                    "url": f"data:image/jpeg;base64,{image_data}"
                }
            }
        ]
    }]
)

print(response.choices[0].message.content)

Модели с Vision

GPT-5.2 — отличное понимание изображений
Gemini 2.5 Flash/Pro — быстрый анализ
Claude Sonnet 4.5 — детальные описания
Llama 4 Maverick — открытая модель с vision

Ключевые возможности

Описание изображений
OCR (извлечение текста)
Анализ документов
Множество моделей
Base64 и URL

Используйте эту возможность с AITUNNEL

Все возможности доступны через единый API. Оплата в рублях, работа без VPN, техподдержка на русском.

Полный функционалОплата в рубляхБез VPN

Начать работуРегистрация за 1 минуту

Поддерживаемые модели

gpt-5.2 gemini-2.5-flash claude-sonnet-4.5