Платиновый партнер

28 августа 2025

Кейс ПСБ и BSS: ИИ-помощник «Катюша» за счет RAG сократил время обработки клиентских запросов в 8 раз

Теперь средняя скорость решения вопросов клиентов в ИИ-помощнике «Катюша» в восемь раз быстрее, чем в стандартном сценарном боте благодаря использованию технологии RAG. Об этом сообщил ПСБ у себя на сайте.

В отличие от сценарного бота, которому для ответа, прописанного в сценарии, требуется задавать уточняющие вопросы, ИИ-помощник с технологией RAG не нуждается в них. При генерации текста в ответ на запрос пользователя такой чат-бот обращается к различным источникам, находя информацию в базах знаний и релевантных документах банка.

Он оперативно анализирует данные и формирует наиболее полный и естественный ответ, адаптируя найденную информацию под контекст вопроса клиента. База знаний, на которую опирается технология RAG, обновляется в реальном времени, что позволяет учитывать актуальные изменения.

«Применение технологии RAG — одна из значимых вех в стратегии внедрения генеративного искусственного интеллекта в процессы ПСБ. Она позволяет за считанные секунды формировать исчерпывающие ответы на любые вопросы, связанные с банковским обслуживанием наших клиентов малого и среднего бизнеса. За счет высокой точности и качества ответов чат-бот с технологией RAG повышает автоматизацию обработки вопросов пользователей: после масштабирования технологии на все тематики мы прогнозируем рост автоматизации практически на 10%», — отметил Дмитрий Шенберг, заместитель директора департамента электронного бизнеса малого и среднего предпринимательства ПСБ.

BSS активно развивает использование технологии RAG (Retrieval Augmented Generation) в клиентском обслуживании для ответов на вопросы об услугах и продуктах банка на основе его материалов. В компании считают, что сейчас открываются большие перспективы в применении больших языковых моделей (LLM) и технологии RAG (Retrieval-Augmented Generation) в бизнесе.

Связка LLM с внутренней Базой знаний конкретного бизнеса позволяет генерировать ответы на основе актуальных данных, минимизируя «галлюцинации». Дает возможность контролировать доступ к информации, исключая утечки. Помогает гибко адаптироваться к новым моделям без перестройки системы.