Используйте AI Vision для извлечения структурированных данных из PDF документов.
Возможности
- Извлечение текста из сканов
- Распознавание таблиц
- Анализ форм и бланков
- Структурирование данных в JSON
Пример использования
import base64
# Конвертируем PDF страницу в изображение
with open("document.png", "rb") as f:
image_data = base64.b64encode(f.read()).decode()
response = client.chat.completions.create(
model="gpt-5.2",
messages=[{
"role": "user",
"content": [
{
"type": "text",
"text": """Извлеки данные из этого счёта в JSON:
{
"номер_счёта": "",
"дата": "",
"поставщик": "",
"покупатель": "",
"товары": [{"название": "", "количество": "", "цена": ""}],
"итого": ""
}"""
},
{
"type": "image_url",
"image_url": {"url": f"data:image/png;base64,{image_data}"}
}
]
}],
response_format={"type": "json_object"}
)
data = json.loads(response.choices[0].message.content)Применение
- Обработка счетов и накладных
- Извлечение данных из договоров
- Анализ анкет и форм
- Оцифровка архивов
Ключевые возможности
- OCR и распознавание
- Извлечение таблиц
- Структурированный вывод
- Работа со сканами
- JSON формат
Решайте задачи быстрее с AI
Подключите AI-модели через AITUNNEL и автоматизируйте выполнение задач. Единый API для GPT-5, Claude, Gemini и других моделей.
Доступные модели
Часто задаваемые вопросы
AITUNNEL — это сервис, предоставляющий доступ к AI API (OpenAI, Claude, Gemini и другим) в России без VPN. Мы работаем как прокси между вами и провайдерами AI, обеспечивая стабильное соединение и оплату в рублях.
Нет, VPN не нужен. AITUNNEL работает напрямую из России. Все запросы идут на российский сервер api.aitunnel.ru, который затем передаёт их провайдерам AI.
Мы принимаем оплату российскими банковскими картами, через СБП, а также по счёту для юридических лиц. Минимальная сумма пополнения — 299 рублей.
Да, AITUNNEL на 100% совместим с официальным OpenAI SDK. Вам нужно только изменить base_url на https://api.aitunnel.ru/v1/ и использовать ваш API ключ AITUNNEL.
Через AITUNNEL доступны все популярные AI модели: GPT-5.2, GPT-4.1, Claude Sonnet 4.5, Gemini 2.5, DeepSeek V3, Llama 4, FLUX 2 для изображений и многие другие.