Vision API (анализ изображений)

Анализируйте изображения с помощью AI Vision моделей

Vision API позволяет AI анализировать и понимать изображения — от простого описания до сложного анализа.

Возможности Vision API

  • Описание содержимого изображений
  • Извлечение текста (OCR)
  • Анализ документов и скриншотов
  • Ответы на вопросы по изображению
  • Сравнение изображений

Пример использования

python
import base64
from openai import OpenAI

client = OpenAI(
    api_key="sk-aitunnel-xxx",
    base_url="https://api.aitunnel.ru/v1/"
)

# Загрузка изображения
with open("image.jpg", "rb") as f:
    image_data = base64.b64encode(f.read()).decode()

response = client.chat.completions.create(
    model="gpt-5.2",  # или gemini-2.5-flash, claude-sonnet-4.5
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "Что изображено на картинке?"},
            {
                "type": "image_url",
                "image_url": {
                    "url": f"data:image/jpeg;base64,{image_data}"
                }
            }
        ]
    }]
)

print(response.choices[0].message.content)

Модели с Vision

  • GPT-5.2 — отличное понимание изображений
  • Gemini 2.5 Flash/Pro — быстрый анализ
  • Claude Sonnet 4.5 — детальные описания
  • Llama 4 Maverick — открытая модель с vision

Ключевые возможности

  • Описание изображений
  • OCR (извлечение текста)
  • Анализ документов
  • Множество моделей
  • Base64 и URL

Используйте эту возможность с AITUNNEL

Все возможности доступны через единый API. Оплата в рублях, работа без VPN, техподдержка на русском.

Полный функционалОплата в рубляхБез VPN
Начать работуРегистрация за 1 минуту

Поддерживаемые модели