Документация › Инструменты › База знаний
База знаний (RAG)
Сюда грузишь факты о бизнесе (прайс, услуги, условия) — бот сам подмешивает нужное в ответы и перестаёт выдумывать.
⏱ 8 мин · 👤 для владельца и оператора · 🟢 live

За 30 секунд:
- База знаний = факты, на которые опирается бот: прайс, услуги, FAQ, условия.
- Грузишь текст, файл (TXT/CSV/PDF/DOCX) или ссылку (URL) — система сама разбивает и индексирует.
- Бот на каждое сообщение ищет подходящие куски и добавляет их в ответ (это RAG, автоматически).
- Лимит: 100 записей на проект, 40 000 символов на документ, файл до 5 МБ.
- Статичные мелочи дешевле держать в промпте; большое/меняющееся — сюда.
Зачем это нужно
Бот знает только то, что ты ему дал. Если прайс есть лишь «в голове» у тебя — бот начнёт выдумывать цифры. База знаний даёт ему точные факты: он ищет в них релевантное под вопрос клиента и отвечает по делу, а не фантазирует. Это разница между «кажется, около 20 тысяч» и «чистка — 18 000 ₸».
Промпт или База знаний?
| Кладём в… | Что |
|---|---|
| 🧠 Промпт | Как себя вести, тон, правила, небольшие неизменные факты (адрес, часы) |
| 📚 База знаний | Объёмное и меняющееся: полный прайс, описания услуг, FAQ, условия доставки |
💡 Правило. Маленький статичный факт (адрес) — в промпт (бесплатно). Большой список (прайс на 50 позиций) — в базу знаний (бот достанет только нужное).
Как добавить
Меню проекта → «База знаний» → «Добавить базу знаний».
- Название — понятное («Прайс услуг», «FAQ доставки»);
- Тип — выбери источник:
- Текст — вставь напрямую (до 40 000 символов);
- Файл — TXT, CSV, PDF, DOCX (до 5 МБ, текст извлечётся сам);
- URL — ссылка на страницу сайта (можно с глубиной сканирования: только страница / +ссылки 1–2 уровня / максимум);
- (для URL) Автообновление — нет / еженедельно / ежемесячно;
- «Добавить» — пойдёт загрузка → индексация → готово.
⚠️ Обработка документа стоит немного (около $0.01 за документ на индексацию, минимальное списание — 1¢) — спишется с баланса. При добавлении показывается оценка токенов.
Как бот это использует
Тебе ничего вызывать не надо — это работает само:
- Клиент пишет вопрос;
- Бот ищет в базе знаний самые похожие по смыслу куски (семантический поиск, не по точным словам);
- До 5 лучших фрагментов (в сумме до 8 000 символов) добавляются в контекст ответа;
- Бот отвечает, опираясь на них.
📌 Пример. В базе — прайс и условия. Клиент: «делаете отбеливание и сколько?». Бот находит строку про отбеливание → отвечает с точной ценой. Про услугу, которой в базе нет, он честно скажет, что уточнит.
Проверь, что работает
В разделе есть «Тест поиска»: вводишь вопрос клиента → видишь, какие фрагменты база вернёт боту и с каким % похожести. Это ровно тот поиск, что бот делает на каждое сообщение. Если по важному вопросу ничего не находит — переформулируй контент или добавь похожий.
Плюс прогони реальные вопросы в Тест-чате — там в «технических деталях» видно, какие источники бот подтянул.
Управление записями
- Фильтры: Все / Активные / Неактивные, поиск по названию;
- Включить/выключить запись (выключенная не участвует в поиске);
- Массовые действия: включить/выключить/удалить выбранные;
- Большие документы система бьёт на фрагменты — их можно посмотреть и отредактировать.
Частые ошибки
| Симптом | Причина | Что делать |
|---|---|---|
| Бот не знает то, что я загрузил | Запись выключена или вопрос непохож на текст | Включи запись; проверь «Тест поиска», переформулируй контент |
| «Почти лимит» / не добавляется | Близко к 100 записям | Удали ненужные, объедини мелкие |
| Загрузил, но бот выдумывает | Факт есть в базе, но промпт не велит на неё опираться | В промпте: «цены и факты бери из базы знаний, не выдумывай» |
| Файл не грузится | Больше 5 МБ или не тот формат | Сократи / используй TXT, CSV, PDF, DOCX |
Вопросы, которые обычно возникают
Чем это отличается от промпта?
Промпт — поведение (всегда в каждом ответе). База знаний — факты (бот достаёт только релевантное под конкретный вопрос). Большие данные в промпте = дорого и бот путается.
Это платно?
Да, чуть-чуть: и индексация документа, и каждый поиск стоят примерно по 1¢ ($0.01). Поиск идёт на каждое сообщение, это учитывается в расходе.
Бот читает весь документ каждый раз?
Нет. Только несколько самых подходящих фрагментов (до 5) под текущий вопрос.
🔧 Под капотом
- RAG (Retrieval-Augmented Generation): документы режутся на чанки, для каждого считаются векторные embeddings. На каждое сообщение клиента — семантический поиск по векторам, топ-5 чанков подмешиваются в контекст (он обрезается до 8 000 символов).
- Лимиты: 100 активных записей/проект, 40 000 символов/документ, файл 5 МБ, в промпт идёт до 8 000 символов из 5 чанков.
- Форматы: TXT, CSV, URL (с глубиной до 3 и автообновлением), PDF, DOCX. URL-скан — до 20 подстраниц, каждая = отдельная запись.
- Стоимость: ≈$0.01 индексация документа + ≈$0.01 за поиск (на каждое сообщение); минимальное списание за эмбеддинг — 1¢.
- Обновления списка — в реальном времени (
use-realtime-kb). RAG — это не функция, а внутренний шаг пайплайна; включать/вызывать не надо.
💬 Простыми словами
База знаний — это справочник твоего бизнеса для бота: цены, услуги, условия, частые вопросы. Ты загружаешь туда текст, документ или ссылку на сайт, а бот сам, на каждый вопрос клиента, достаёт оттуда нужный кусочек и отвечает точно, не выдумывая. Маленькие вещи (адрес, часы работы) проще написать прямо в инструкции бота, а вот большой прайс или список услуг — сюда. Есть кнопка «Тест поиска»: вводишь вопрос и видишь, что бот найдёт — удобно проверить, что он не промахнётся.
Дальше: → Дожимы
Связано: Системный промпт · Как бот думает · Тест-чат
Не получилось? → Бот не отвечает