Современные экспертные системы (ЭС) начали разрабатываться исследователями искусственного интеллекта в 1970-х годах, а в 1980-х получили коммерческое подкрепление. Предтечи экспертных систем были предложены в 1832 году С. Н. Корсаковым, создавшим механические устройства, так называемые «интеллектуальные машины», позволявшие находить решения по заданным условиям[1].
В настоящее время существует шесть этапов создания ЭС:
Идентификация. Этап идентификации связан, прежде всего, с осмыслением тех задач, которые предстоит решить будущей ЭС, и формированием требований к ней. Результатом данного этапа является ответ на вопрос, что надо сделать и какие ресурсы необходимо задействовать.
Концептуализация. На данном этапе проводится содержательный анализ проблемной области, выявляются используемые понятия и их взаимосвязи, определяются методы решения задач.
Формализация. На данном этапе определяются состав средств и способы представления декларативных и процедурных знаний, осуществляется это представление и в итоге формируется описание решения задачи ЭС на предложенном (инженером по знаниям) формальном языке.
Выполнение. Цель этого этапа — создание одного или нескольких прототипов ЭС, решающих требуемые задачи.
Тестирование. В ходе данного этапа производится оценка выбранного способа представления знаний в ЭС в целом.
Опытная эксплуатация. На этом этапе проверяется пригодность ЭС для конечного пользователя.
На первых этапах создания ЭС формируется база знаний – основа будущей системы. Создание базы знаний для ЭС, так же базируется на ряде основных шагов:
Начальное накопление и приобретение знаний.
Интерпретация и структурирование знаний
Приобретение детальных знаний.
Использование
Как правило, экспертные системы создаются для решения практических задач в некоторых узкоспециализированных областях, где большую роль играют знания «бывалых» специалистов. Часть знаний можно получить из хорошо структурированных источников, таких как книжные издания, инструкции, документы, но другую часть неизбежно придётся получать из знаний экспертов. Одно из первых рассмотрений интервью как метода формализации знаний проведено в Newel, в 1972 году, проблемы, возникающие при извлечении экспертных знаний, некоторые психологи связывают с так называемой когнитивной защитой. С тех пор для сбора знаний были созданы множество вариантов ведения интервью, способных преодолеть когнитивную защиту.
Интервью является активным, индивидуальным методом извлечения знаний, а именно индивидуальные методы нашли наиболее широкое применение. Метод интервьюирования выгодно отличается от метода анкетирования тем, что позволяет аналитику опускать ряд вопросов в зависимости от ситуации, вставлять новые вопросы в анкету, изменять темы и разнообразить общение, избегая скуки и снимая возможное напряжение эксперта.
Процесс взаимодействия инженера по знаниям (аналитика) с экспертом-специалистом включает три основных этапа[2].
Подготовительный этап.
Аналитику необходимо на этом этапе, познакомиться с предметной областью с помощью специализированной литературы. Усвоить основные понятия и определения, что бы говорить с экспертом «на его языке» и избегать неуместных вопросов.
Установление "общего кода"
На этом этапе необходимо определить главные понятия, т. е. выработать словарную основу базы знаний; уровень детализации; взаимосвязи между понятиями.
Гносеологический этап.
На этом этапе происходит выяснение закономерностей, присущих предметной области, условий достоверности и истинности утверждений, структурирование за счет введения отношений и т. п.
Многие технологии извлечения знаний основаны на интервью, наблюдении и записи того, как эксперт решает проблему. Весь процесс интервью обычно записывается на видеокамеру или диктофон, для более тщательной экспертизы. В дальнейшем на подобные записи ссылаются как на неформальную базу знаний[3, стр. 101].
Гровер (Grover (1983)) определил четыре технологии интервью[4, стр. 3]:
Передовое моделирование сценариев.
Предметная область моделируется и исследуется в лабораторных условиях. Эксперт рассказывает о способах решения проблемы, на основе собственных знаний.
Задача декомпозиции.
Инженер по знаниям делит общую задачу на подзадачи и предлагает эксперту найти способы для решения каждой из подзадач.
Процедурное моделирование.
Гровер (1983) использует этот термин для анализа протоколов. По его мнению, контроль инженера по знаниям необходим.
Чистая реклассификация.
В результате диалога аналитика и эксперта задачи разделяются на ещё более мелкие, выделяются конкретные объекты и отношения между ними.
Методы интервью не упомянутые Гровером:
Разбиение на ступени
Эксперта просят назвать и описать важные понятия предметной области. В дальнейшем эти понятия будут использованы в качестве основы для интервью.
В KRITON была создана полностью автоматическая система проведения интервью. Это означает, что эксперт в ней общается напрямую с системой, не прибегая к услугам инженера по знаниям. Сочетание передового моделирования сценариев и метода разбиения на ступени используется для изучения предметной области.
Во главу метода поставлена методика троек связанных семантических концепций, который заключается в том, что эксперту предлагается определить, чем две из этих концепций отличаются от третьей.
Если эксперт затрудняется назвать отличительный признак, система запускает стратегию разбиения на ступени и предпринимает попытку выяснения таксономической структуры этих понятий с целью выявления признаков, их различающих.
Помимо интервьюирования существует ещё ряд методов формализации знаний эксперта. Например, на начальном этапе бывает полезным метод наблюдения. Суть его заключается в том, что бы следить за действиями эксперта и фиксировать все его пояснения, при этом аналитик не вмешивается в процесс. Этот метод не даёт таких результатов, как интервью, но может быть использован инженером по знаниям даже на подготовительном этапе работы с экспертом. Иногда этот метод дополняют, методом «протоколирование мыслей вслух». При этом эксперт не просто комментирует свои действия, но и объясняет цепочку своих рассуждений.
Другой метод – анкетирование. Его использование подразумевает уже некоторую подкованность инженера по знаниям в предметной области. Однако, при этом, большие анкеты могут вызывать у эксперта негативные эмоции, а как следствие – некачественную передачу данных. Для того что бы избежать подобной ситуации инженер по знаниям должен обладать некоторыми знаниями психологии, что бы составить анкету правильно. Другими недостатками этого метода является отсутствие контекста, обратной связи и вероятности неправильного понимания вопросов экспертом.
В некоторых случаях возможно объединение экспертов, и проведение группового интервьюирования в формате мозгового штурма или круглого стола. Это позволяет получать более объективные знания или заметить ошибки одного из экспертов, однако использование подобной техники менее эффективно, нежели личное интервью. Подобный вариант следует использовать в конце создания базы знаний, и лишь для вопросов хорошо известных каждому из экспертов.
Существуют так же текстологические методы извлечения знаний, основанные на изучении текстов учебников, специальной литературы и документов. Текстология — это наука, целью которой является практическое прочтение текстов, изучение и интерпретация литературных источников, а также рассмотрение семиотических, психолингвистических и других аспектов извлечения знаний из текстов. Схема извлечения знаний из специальных текстов приведена на рис.1, где М1 — смысл, заложенный автором и основанный на его собственной модели мира; М2 — смысл, который постигает инженер по знаниям; I — интерпретация текста, изложенного словесно; Т — словесное изложение знаний; V — результат вербализации.
T
Рис. 1
Научный текст Т, который формируется автором на основе модели M1, включает в себя пять компонентов, погруженных в языковую среду L; T = (α, β, γ, δ, θ) , где - α первичный материал наблюдений; β — система научных понятий; γ — субъективный взгляд автора; δ — дополнительная информация, не касающаяся научного знания (общие места); θ — заимствования. На процесс понимания (интерпретации) I и на модель М2 влияют следующие компоненты: М2 = [(α, β, γ, θ) ϖ, ε, φ], где (α, β, γ, θ) - экстракт компонентов, почерпнутый из текста Т; ϖ — предварительные знания аналитика о предметной области; ε — общенаучная эрудиция инженера по знаниям; φ — личный опыт аналитика.
Автор книги, являющийся в данном случае экспертом, на основании собственной модели мира М1 пишет книгу, представляя свои знания в виде текста. Затем инженер по знаниям на основании своей модели знаний М2 и информации, почерпнутой из текста Т, интерпретирует знания эксперта. Схема процесса извлечения знаний из текста показывает, что смысл М1, заложенный автором книги, отличается от смысла М2, который постигает читатель (инженер по знаниям). Эти различия определяются тем, насколько развиты факторы ϖ, ε и φ у конкретного аналитика (читателя).[5]
- Литература:
- Интеллектуальные машины С.Н. Корсакова (http://www.homeoscope.ru/)
- Курс лекций по теме: «Системы искусственного интеллекта» Составитель: Даурова А. А. Владикавказ, 2008 г.
GWAI-92: Advanced in Artificial Intelligence. 16 German Conference on Artificial both, Germany, August/September 1992
KRITON: a knowledge-acquisition tool for expert systems.
- Методы извлечения знаний