Rerank API — ранжирование документов по релевантности

Переранжируйте результаты поиска по релевантности с Cohere Rerank API

Rerank API позволяет переупорядочить список документов по релевантности к поисковому запросу. Каждый документ получает оценку от 0 до 1 — чем выше, тем более релевантен запросу.

Зачем нужен Rerank?

Классический векторный поиск (embeddings) находит семантически похожие тексты, но не всегда самые релевантные. Rerank — это второй этап, который точно оценивает каждый документ относительно запроса.

text
Запрос → Vector Search (top-50 кандидатов) → Rerank → top-5 → LLM

Быстрый старт

python
import requests

response = requests.post(
    "https://api.aitunnel.ru/v1/rerank",
    headers={
        "Authorization": "Bearer sk-aitunnel-xxx",
        "Content-Type": "application/json"
    },
    json={
        "model": "rerank-4-pro",
        "query": "Что такое машинное обучение?",
        "documents": [
            "Машинное обучение — раздел AI, где модели обучаются на данных.",
            "Python — популярный язык программирования.",
            "Нейронные сети — основа современного ML.",
            "SQL используется для работы с базами данных.",
        ],
        "top_n": 2
    }
)

for r in response.json()["results"]:
    print(f"[{r['relevance_score']:.3f}] {r['document']['text'][:60]}")
# [0.987] Машинное обучение — раздел AI, где модели обучаются...
# [0.743] Нейронные сети — основа современного ML.

JavaScript

javascript
const response = await fetch("https://api.aitunnel.ru/v1/rerank", {
  method: "POST",
  headers: {
    "Authorization": "Bearer sk-aitunnel-xxx",
    "Content-Type": "application/json"
  },
  body: JSON.stringify({
    model: "rerank-4-pro",
    query: "What is machine learning?",
    documents: [
      "Machine learning is a subset of AI.",
      "Python is a popular programming language.",
      "Neural networks are the basis of modern ML.",
    ],
    top_n: 2
  })
});

const { results } = await response.json();

Доступные модели

МодельКонтекстОсобенности
rerank-4-pro32K токеновМаксимальная точность
rerank-4-fast32K токеновСкорость + качество
rerank-v3.54K токенов100+ языков, стабильная

Параметры запроса

ПараметрТипОписание
modelstringНазвание модели
querystringПоисковый запрос
documentsstring[] или {text: string}[]Список документов
top_nnumber?Количество результатов для возврата

Интеграция с LangChain

python
from langchain.retrievers import ContextualCompressionRetriever
from langchain_community.document_compressors import CohereRerank

reranker = CohereRerank(top_n=3, model="rerank-4-pro")

retriever = ContextualCompressionRetriever(
    base_compressor=reranker,
    base_retriever=vectorstore.as_retriever(search_kwargs={"k": 20})
)

docs = retriever.invoke("Как настроить Redis?")

Применение

  • RAG-системы — точный контекст для LLM
  • Поисковые движки — ранжирование результатов
  • Рекомендательные системы — релевантные товары/контент
  • Поддержка клиентов — лучший ответ из FAQ
  • Юридический поиск — релевантные прецеденты

Ключевые возможности

  • Cohere Rerank 4 Pro — максимальная точность
  • Rerank 4 Fast — скорость и качество
  • Оценка релевантности от 0 до 1
  • Поддержка 100+ языков включая русский
  • 32K токенов контекст
  • Доступ без VPN, оплата в рублях

Используйте эту возможность с AITUNNEL

Все возможности доступны через единый API. Оплата в рублях, работа без VPN, техподдержка на русском.

Полный функционалОплата в рубляхБез VPN
Начать работуРегистрация за 1 минуту

Поддерживаемые модели