Rerank API — ранжирование документов по релевантности
Переранжируйте результаты поиска по релевантности с Cohere Rerank API
Rerank API позволяет переупорядочить список документов по релевантности к поисковому запросу. Каждый документ получает оценку от 0 до 1 — чем выше, тем более релевантен запросу.
Зачем нужен Rerank?
Классический векторный поиск (embeddings) находит семантически похожие тексты, но не всегда самые релевантные. Rerank — это второй этап, который точно оценивает каждый документ относительно запроса.
text
Запрос → Vector Search (top-50 кандидатов) → Rerank → top-5 → LLMБыстрый старт
python
import requests
response = requests.post(
"https://api.aitunnel.ru/v1/rerank",
headers={
"Authorization": "Bearer sk-aitunnel-xxx",
"Content-Type": "application/json"
},
json={
"model": "rerank-4-pro",
"query": "Что такое машинное обучение?",
"documents": [
"Машинное обучение — раздел AI, где модели обучаются на данных.",
"Python — популярный язык программирования.",
"Нейронные сети — основа современного ML.",
"SQL используется для работы с базами данных.",
],
"top_n": 2
}
)
for r in response.json()["results"]:
print(f"[{r['relevance_score']:.3f}] {r['document']['text'][:60]}")
# [0.987] Машинное обучение — раздел AI, где модели обучаются...
# [0.743] Нейронные сети — основа современного ML.JavaScript
javascript
const response = await fetch("https://api.aitunnel.ru/v1/rerank", {
method: "POST",
headers: {
"Authorization": "Bearer sk-aitunnel-xxx",
"Content-Type": "application/json"
},
body: JSON.stringify({
model: "rerank-4-pro",
query: "What is machine learning?",
documents: [
"Machine learning is a subset of AI.",
"Python is a popular programming language.",
"Neural networks are the basis of modern ML.",
],
top_n: 2
})
});
const { results } = await response.json();Доступные модели
| Модель | Контекст | Особенности |
|---|---|---|
| rerank-4-pro | 32K токенов | Максимальная точность |
| rerank-4-fast | 32K токенов | Скорость + качество |
| rerank-v3.5 | 4K токенов | 100+ языков, стабильная |
Параметры запроса
| Параметр | Тип | Описание |
|---|---|---|
model | string | Название модели |
query | string | Поисковый запрос |
documents | string[] или {text: string}[] | Список документов |
top_n | number? | Количество результатов для возврата |
Интеграция с LangChain
python
from langchain.retrievers import ContextualCompressionRetriever
from langchain_community.document_compressors import CohereRerank
reranker = CohereRerank(top_n=3, model="rerank-4-pro")
retriever = ContextualCompressionRetriever(
base_compressor=reranker,
base_retriever=vectorstore.as_retriever(search_kwargs={"k": 20})
)
docs = retriever.invoke("Как настроить Redis?")Применение
- RAG-системы — точный контекст для LLM
- Поисковые движки — ранжирование результатов
- Рекомендательные системы — релевантные товары/контент
- Поддержка клиентов — лучший ответ из FAQ
- Юридический поиск — релевантные прецеденты
Ключевые возможности
- Cohere Rerank 4 Pro — максимальная точность
- Rerank 4 Fast — скорость и качество
- Оценка релевантности от 0 до 1
- Поддержка 100+ языков включая русский
- 32K токенов контекст
- Доступ без VPN, оплата в рублях
Используйте эту возможность с AITUNNEL
Все возможности доступны через единый API. Оплата в рублях, работа без VPN, техподдержка на русском.
Полный функционалОплата в рубляхБез VPN
Начать работуРегистрация за 1 минуту