Vision API позволяет AI анализировать и понимать изображения — от простого описания до сложного анализа.
Возможности Vision API
- Описание содержимого изображений
- Извлечение текста (OCR)
- Анализ документов и скриншотов
- Ответы на вопросы по изображению
- Сравнение изображений
Пример использования
python
import base64
from openai import OpenAI
client = OpenAI(
api_key="sk-aitunnel-xxx",
base_url="https://api.aitunnel.ru/v1/"
)
# Загрузка изображения
with open("image.jpg", "rb") as f:
image_data = base64.b64encode(f.read()).decode()
response = client.chat.completions.create(
model="gpt-5.2", # или gemini-2.5-flash, claude-sonnet-4.5
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "Что изображено на картинке?"},
{
"type": "image_url",
"image_url": {
"url": f"data:image/jpeg;base64,{image_data}"
}
}
]
}]
)
print(response.choices[0].message.content)Модели с Vision
- GPT-5.2 — отличное понимание изображений
- Gemini 2.5 Flash/Pro — быстрый анализ
- Claude Sonnet 4.5 — детальные описания
- Llama 4 Maverick — открытая модель с vision
Ключевые возможности
- Описание изображений
- OCR (извлечение текста)
- Анализ документов
- Множество моделей
- Base64 и URL
Используйте эту возможность с AITUNNEL
Все возможности доступны через единый API. Оплата в рублях, работа без VPN, техподдержка на русском.
Полный функционалОплата в рубляхБез VPN
Начать работуРегистрация за 1 минуту