В работе рассмотрены возможности применения чат-ботов в связке с голосовыми помощниками для улучшения взаимодействия между бизнесом и клиентами. Подчеркивается актуальность темы в связи с развитием технологий обработки естественного языка и искусственного интеллекта. Обоснована важность чат-ботов и голосовых помощников для оптимизации процессов, обеспечения круглосуточной поддержки и повышения конкурентоспособности бизнеса за счет улучшения пользовательского опыта.
Ключевые слова: чат-боты, голосовые помощники, искусственный интеллект, обработка естественного языка, автоматизация, клиентский опыт, бизнес, поддержка клиентов, конкурентоспособность.
Актуальность исследования особенностей реализации и возможностей чат-ботов и голосовых помощников обусловлена тем, что большинство бизнесов обращаются с запросом получения продукта, который способен улучшить взаимодействие между клиентом и им. На сегодняшний день многим компаниям необходимо иметь возможность круглосуточно обрабатывать запросы клиентов, помогать им, отвечать на вопросы и анализировать статистику запросов на ту или иную тематику. Но, чтобы покрыть растущий с каждым днем потребности клиентов, необходимо иметь большой штат сотрудников, который сможет всё время быть на связи с клиентом для обработки его потребностей, это дорогостоящий и сложно воспроизводимый способ работы. В то же время наблюдается стремительное развитие технологий обработки естественного языка и искусственного интеллекта, благодаря которым появляется возможность автоматизировать и персонализировать обслуживание клиентов. Чат-боты и голосовые помощники являются ключевыми факторами, которые помогают бизнесу улучшить качество взаимодействия с клиентами и повысить свою конкурентоспособность. Поэтому бизнес прибегает к использованию перечисленных технологий, поскольку они способны обеспечить круглосуточную поддержку клиента, оптимизировать процессы и улучшить пользовательский опыт. [1]
Введем основные понятия, рассматриваемые в статье, и перечислим виды чат-ботов и голосовых помощников.
Чат-бот — это программа с искусственным интеллектом, имитирующая диалог с человеком и настроенная на мгновенный ответ на вопрос пользователя через мессенджеры, сайты, телефон или мобильное приложение. Он имитирует разговор с пользователем через текстовые или голосовые интерфейсы. [2]
NLP (Natural Language Processing) — пересечение машинного обучения и математической лингвистики, направленное на изучение методов анализа и синтеза естественного языка.
ASR (Automatic Speech Recognition) — это технология, использующая машинное обучение и искусственный интеллект (ИИ) для преобразования человеческой речи в письменный текст.
TTS (Text To Speech) — технология преобразования текста в речь. [3]
По способу общения делятся на: сценарные, текстовые и голосовые.
Начнем со сценарных ботов. Они функционируют на основе заранее разработанных сценариев взаимодействия, прописанных в виде последовательности шагов или диалоговых деревьев. Сценарные боты имеют строгую структуру: каждый шаг диалога определяется заранее, и бот следует этому пути в зависимости от ответов пользователя. Разработчику легко прогнозировать его поведение, так как ответы бота заранее известны и ограничены сценарием.
Такой вид бота отлично подходит для стандартных процессов с фиксированной последовательной логикой, таких как, вопрос-ответ, регистрация пользователей, проведение опросов или сбор данных. Практическое применение, существующее в настоящее время: регистрация на мероприятие, бронирование столика в ресторане и тд. Бот ведет пользователя через несколько шагов, начиная с приветствия и заканчивая подтверждением регистрации, задавая при этом вопросы о дате, времени, имени. Пример сценарного чат-бота представлен на рисунке 1.
Рис. 1. Взаимодействие со сценарным ботом
Текстовые боты, следующий вид чат-ботов, взаимодействует с пользователем через текстовые сообщения, используя платформы мессенджеров, чаты на веб-сайтах или мобильные приложения. Этот вид чат-ботов имеет расширенный функционал, который включает в себя возможность получения информации ос удаленного сервера, прописывание методов обработки этой информации. На рисунке 2 представлен пример ответа текстового робота на запрос клиента. Информация о рекордах погоды запрашивается с удаленного сервера.
Рис. 2. Связь с сервером
Также отличием является то, что клиент задает сам вопросы, а не действует по навигации, предусмотренной логикой сценария. Этот вопрос обрабатывается и определяется в определенную тематику, которая имеет собственную логику работы с данными и предоставления ответа.
Как правило, при разработке текстового бота отдельно прописываются варианты запросов (вопросы клиента). Дальше прописываются возможные ответы и их вариации. Также предусмотрена логика перехода от одного запроса к другому без потери контекста или, при необходимости, с его очисткой. Предусмотрены обработки аномалий: когда вопрос не подходит ни под одну из тематик, тогда клиента переводят на оператора.
Текстовые роботы быстро интегрируемы в мессенджеры, они позволяют пользователям получать информацию или выполнять задачи без необходимости перехода к другим приложениям или интерфейсам. Благодаря использованию NLP, текстовые боты могут обрабатывать разнообразные текстовые запросы и предоставлять контекстно-релевантные ответы. [4]
Текстовые чат-боты используются в клиентской поддержке. Бот может отвечать на запросы пользователей о статусе их заказов, проблемах с продуктами или предоставлять информацию о новых предложениях.
На рисунке 3 представлен пример определения одной тематики для двух разных запросов от пользователя.
Рис. 3. Ответы на запросы
Текстовые чат-боты и голосовые помощники тесно связаны. Существует возможность прописать одну логику для работы обеих структур.
У них могут быть как общие компоненты, так и собственные. В обоих случаях используется один и тот же механизм NLP (Natural Language Processing). Также у них, как правило, общая бизнес-логика, например, процедура обработки запросов, управления данными и логика принятия решений. И генерация ответов может основываться на той же логике и наборе данных. Единственное различие может заключаться в формате представления (текст или голос).
К специфическим компонентам относятся: ASR (Automatic Speech Recognition)– распознание речи, TTS (Text-to-Speech) — синтез речи и обработка ввода/вывода.
Процесс распознавания речи для голосового помощника подразумевает под собой специальные компоненты, которые позволяют преобразовывать речь в текст, например, Яндекс SpeechKit, ЦРТ (Центр Разработки Телекоммуникаций).
Синтез речи производит обратное действие, он преобразует текст в речь. При воспроизведении текста есть возможность регулировать паузы между словами, чтобы учесть знаки препинания, проставить ударение или прописать правильное произношение числительных. В качестве таких компонентов можно использовать продукты ЦРТ, Сбер TTS и Tinkoff VoiceKit. [5]
Главными преимуществами для бизнеса являются круглосуточная работа, снижение затрат на поддержку и ускорение обслуживания клиентов. Однако есть и вызовы: боты могут испытывать трудности с интерпретацией сложных запросов, а также зависят от стабильности технической инфраструктуры.
Таким образом, разработка чат-ботов и голосовых помощников предоставляет бизнесу широкие возможности для улучшения взаимодействия с клиентами. Выбор конкретного типа помощника зависит от потребностей бизнеса. Несмотря на существующие проблемы (невозможность предусмотреть все сценарии и распознавание акцентов), продолжаются активные разработки в области искусственного интеллекта для их решения.
Литература:
- Иванов И. И. Разработка интеллектуальных систем: Чат-боты и голосовые помощники. — М.: Технополис, 2020. — 320 с.
- Петров П. П., Смирнов С. С. Искусственный интеллект и машинное обучение в бизнесе. — СПб.: Наука и Техника, 2019. — 450 с.
- Weizenbaum, J. ELIZA — A computer program for the study of natural language communication between man and machine. Communications of the ACM, 1966. — 36–45с.
- Jurafsky, D., Martin, J. H. (2023). Speech and language processing (3rd ed.). Prentice Hall. 2023.
- Zou & Lu. A survey of voice assistant technology in business. 2022.