Rerank API — ранжирование документов по релевантности

Переранжируйте результаты поиска по релевантности с Cohere Rerank API

Rerank API позволяет переупорядочить список документов по релевантности к поисковому запросу. Каждый документ получает оценку от 0 до 1 — чем выше, тем более релевантен запросу.

Зачем нужен Rerank?

Классический векторный поиск (embeddings) находит семантически похожие тексты, но не всегда самые релевантные. Rerank — это второй этап, который точно оценивает каждый документ относительно запроса.

text

Запрос → Vector Search (top-50 кандидатов) → Rerank → top-5 → LLM

Быстрый старт

python

import requests

response = requests.post(
    "https://api.aitunnel.ru/v1/rerank",
    headers={
        "Authorization": "Bearer sk-aitunnel-xxx",
        "Content-Type": "application/json"
    },
    json={
        "model": "rerank-4-pro",
        "query": "Что такое машинное обучение?",
        "documents": [
            "Машинное обучение — раздел AI, где модели обучаются на данных.",
            "Python — популярный язык программирования.",
            "Нейронные сети — основа современного ML.",
            "SQL используется для работы с базами данных.",
        ],
        "top_n": 2
    }
)

for r in response.json()["results"]:
    print(f"[{r['relevance_score']:.3f}] {r['document']['text'][:60]}")
# [0.987] Машинное обучение — раздел AI, где модели обучаются...
# [0.743] Нейронные сети — основа современного ML.

JavaScript

javascript

const response = await fetch("https://api.aitunnel.ru/v1/rerank", {
  method: "POST",
  headers: {
    "Authorization": "Bearer sk-aitunnel-xxx",
    "Content-Type": "application/json"
  },
  body: JSON.stringify({
    model: "rerank-4-pro",
    query: "What is machine learning?",
    documents: [
      "Machine learning is a subset of AI.",
      "Python is a popular programming language.",
      "Neural networks are the basis of modern ML.",
    ],
    top_n: 2
  })
});

const { results } = await response.json();

Доступные модели

Модель	Контекст	Особенности
rerank-4-pro	32K токенов	Максимальная точность
rerank-4-fast	32K токенов	Скорость + качество
rerank-v3.5	4K токенов	100+ языков, стабильная

Параметры запроса

Параметр	Тип	Описание
`model`	string	Название модели
`query`	string	Поисковый запрос
`documents`	string[] или {text: string}[]	Список документов
`top_n`	number?	Количество результатов для возврата

Интеграция с LangChain

python

from langchain.retrievers import ContextualCompressionRetriever
from langchain_community.document_compressors import CohereRerank

reranker = CohereRerank(top_n=3, model="rerank-4-pro")

retriever = ContextualCompressionRetriever(
    base_compressor=reranker,
    base_retriever=vectorstore.as_retriever(search_kwargs={"k": 20})
)

docs = retriever.invoke("Как настроить Redis?")

Применение

RAG-системы — точный контекст для LLM
Поисковые движки — ранжирование результатов
Рекомендательные системы — релевантные товары/контент
Поддержка клиентов — лучший ответ из FAQ
Юридический поиск — релевантные прецеденты

Ключевые возможности

Cohere Rerank 4 Pro — максимальная точность
Rerank 4 Fast — скорость и качество
Оценка релевантности от 0 до 1
Поддержка 100+ языков включая русский
32K токенов контекст
Доступ без VPN, оплата в рублях

Используйте эту возможность с AITUNNEL

Все возможности доступны через единый API. Оплата в рублях, работа без VPN, техподдержка на русском.

Полный функционалОплата в рубляхБез VPN

Начать работуРегистрация за 1 минуту

Поддерживаемые модели

rerank-4-pro rerank-4-fast rerank-v3.5