Советы по составлению базы знаний для ИИ-оператора
Качество и точность ответов ИИ-оператора напрямую зависят от того, какие данные он получил для обучения. В DiveChat предусмотрен блок «Дополнительные материалы», куда вы можете загрузить до 5 файлов с основной информацией о вашем бизнесе.
Подготовка материалов
Прежде чем загружать файлы, определите, какая информация чаще всего требуется клиентам. Мы рекомендуем подготовить документы по следующим направлениям:
- Прайс-листы: актуальная сетка цен (важно для корректного информирования о стоимости).
- Часто задаваемые вопросы (FAQ): список типовых обращений и готовых ответов на них.
- География и контакты: адреса точек продаж, филиалов и графики их работы.
- Каталог продуктов и услуг: детальные описания, технические характеристики и мануалы.
- Маркетинг: подробности действующих акций, условия применения промокодов и спецпредложений.
- База советов: рекомендации и лайфхаки по использованию ваших продуктов.
- Юридический блок: условия возврата, договоры-оферты и политика конфиденциальности.
Технические требования к файлам
ИИ-оператор DiveChat поддерживает большинство современных текстовых и табличных форматов. Убедитесь, что ваши файлы соответствуют следующим параметрам:
- Допустимые форматы: .docx, .pptx, .csv, .html, .rtf, .xlsx, .xml, .md, .txt, .json, .pdf.
- Лимит по весу: размер одного файла не должен превышать 30 Мб.
- Количество: в один профиль ИИ-оператора можно загрузить не более 5 файлов.
Правила структурирования данных
Чтобы нейросеть мгновенно находила нужный фрагмент текста и не ошибалась в фактах, придерживайтесь следующих правил работы с данными:
- Принцип «Одна мысль — один абзац». Структурируйте текст так, чтобы каждая логическая единица данных была отделена. Избегайте «простыней» текста.
- Логическая иерархия. Активно используйте заголовки и подзаголовки внутри документов. Это помогает ИИ ориентироваться в контексте.
- Содержательные названия. Называйте файлы максимально понятно, например: «Прайс_услуги_клининг_2024.pdf» вместо «Документ1.pdf». Название файла — это дополнительная подсказка для ИИ о его содержимом.
- Чистота данных. Перед загрузкой проверьте тексты на опечатки и удалите дублирующуюся информацию, чтобы ИИ не путался в разных версиях одного и того же правила.
- Работа с таблицами (Excel/CSV). Убедитесь, что в таблице нет объединенных ячеек (они мешают анализу данных). Следите, чтобы все значимые ячейки были заполнены.
Дополнительное тегирование файлов
Чтобы существенно повысить точность поиска ИИ-оператора по вашим документам, используйте метод разметки данных. Если вы заключите критически важную информацию в двойные квадратные скобки, нейросеть будет распознавать ее как уникальный идентификатор и приоритетный объект для ответа.
Что рекомендуется тегировать?
Мы советуем размечать таким образом уникальные сущности, которые легко спутать с похожими позициями:
- Артикулы и серийные номера:
[[LX-500-PRO]]. - Названия специфических тарифов:
[[Ультра-Бизнес-2026]]. - Сложные технические аббревиатуры или модели:
[[VR-сенсор-V3]]. - Уникальные условия или ограничения:
[[Бесплатный-возврат-14-дней]].
Как это работает на практике?
Представьте, что клиент пишет в чат: «Какая мощность у портативной станции Энерго-Куб XT-22 и подойдет ли она для кемпинга?».
Благодаря тегу [[XT-22]] в вашей базе знаний, ИИ-оператор мгновенно идентифицирует конкретную модель из сотен других и ответит строго по вашим техническим условиям: «Портативная станция Энерго-Куб XT-22 имеет мощность 1500 Вт, что идеально подходит для обеспечения энергией кемпинга. Все характеристики подтверждены производителем».
Важные нюансы разметки
- Кросс-документальный поиск. Если одинаковые теги (например, артикул запчасти) встречаются в разных файлах (в прайсе и в инструкции), ИИ-оператор самостоятельно соберет данные из всех источников для формирования максимально полного ответа.
- Обновление данных. В уже загруженных документах проставить теги через интерфейс системы нельзя. Вам необходимо подготовить новые версии файлов на своем устройстве (используя автозамену в Word, Excel или специальные скрипты), удалить старые версии из DiveChat и загрузить протегированные документы заново.
Проверка и обновление
После загрузки материалов обязательно проведите испытания базы знаний ИИ-оператора:
- Тестирование. Задайте ИИ-оператору 5-10 вопросов, ответы на которые есть в файлах. Убедитесь, что он нашел информацию и передал её корректно.
- Актуализация. Возьмите за правило обновлять файлы базы знаний сразу после изменения цен или условий работы. Актуальные данные — залог доверия ваших клиентов.
Если у вас возникли сложности с конвертацией файлов или структурированием сложных таблиц для обучения ИИ, наши специалисты техподдержки помогут вам подготовить материалы в чате на сайте DiveChat.