Цель данной работы заключается в изучении вопросов, касающихся особенностей работы с онтологической моделью данных. В работе рассмотрено понятие и особенности онтологической модели данных, изучены основные преимущества и недостатки подобного рода модели. Рассмотрены практические сферы применения онтологических моделей данных. Рассмотрены средства, используемые для работы с онтологической моделью данных. В заключение работы отмечается высокая перспективность данной технологии и актуальность продолжения исследований, проводимых в данной сфере.
Ключевые слова: онтология, модель данных, Protégé, RDF, OWL, объектная модель, корпоративный портал.
Ключевым фактором всего современного мира является достаточно широкое распространение информационных систем и технологий, которые проникли, без исключения, в каждую сферу деятельности. Одним из важнейших элементов информационного социума выступает сеть «Интернет», которая позволяет получать доступ к необходимым для общества данным практически из любой точки мира. Очевидно, что работа с подобного рода объемами данных и обеспечение свободного доступа к ним является достаточно сложным процессом, который необходимо автоматизировать для повышения уровня его надежности. Для этих целей проектируются различные современные информационные системы и технологии [1].
Для построения современных информационных систем, позволяющих решать данные вопросы, могут применяться различные модели данных, в том числе и онтологическая. Онтологические модели к настоящему времени получили достаточно широкое распространение в тех сферах деятельности, в которых необходимо выявлять новую информацию или же пытаться обнаружить скрытые связи у каждой из отдельных частей системы. Тем сама они представляются альтернативными вариантами уже давно применяющихся на практике традиционных информационных баз. К числу наиболее успешных примеров можно привести известные достаточно широкому кругу людей knowledge graph, которую можно применять для нахождения необходимый данных во всемирной паутине с более высоким уровнем качества.
В связи с вышесказанным можно с уверенностью сказать, что изучение вопросов, которые касаются онтологической модели данных и совместной работы с ними, является весьма актуальным в настоящее время.
Если рассматривать понятие онтологической модели с математической точки зрения, то под ним понимают дескриптивную логику, которая основывается на предположении о том, что все данные могут быть отображены в форме цепочки триплета. Онтологическая модель, в таком случае, может быть изображена в виде графа, ребро которого представляет собой имеющиеся взаимоотношения между сущностями, а в вершинах отображаются определенные сущности. На практике применяется две базовых технологии для сохранности антологической модели RDF (Resource Description Framework) и OWL (Ontology Web Language). В более широком смысле данная модель данных представляет собой информационную базу, которая обладает следующими ключевыми характеристиками:
– применение универсальных инструментов для работы с данными;
– направленность на структурирование данных и их последующее сохранение;
– невозможность использования с целью прогнозирования последующих состояний рассматриваемой сферы [2].
К числу основных преимуществ подобного рода моделей данных можно выделить:
– данные, которые не попали в онтологическую модель, будут относиться к категории неизвестных, а в рамках традиционных информационных таблиц такая информация была бы воспринята как ошибочная;
– при использовании онтологических моделей экземпляры зачастую обладают несколькими именами, а в рамках традиционных информационных таблиц каждый экземпляр обладает уникальным названием;
– при помощи онтологической модели, как отмечалось ранее, становится возможным выявить неявные взаимосвязи между различными сущностями, а в рамках традиционных информационных таблиц происходит их жесткое разграничение и однозначность трактовки.
Однако, несмотря на все вышесказанное, подобного рода модели данных обладают также определенными недостатками, среди которых выделяются следующие:
– подобного рода модели могут вызывать определенные противоречия при некорректном запросе, для решения которых требуется использование строгих логических законов;
– существующие взаимосвязи между объектами в данной модели являются более сложными и многообразными по сравнению с классическими информационными базами, в связи с чем высока вероятность возникновения проблемных вопросов, связанных с масштабируемостью моделей.
В настоящее время можно перечислить следующие технологии, в которых в настоящее время на практике применяются онтологические модели в информационной сфере:
- Онтологическая модель как граф. Язык SPARQL.
- Машины и правила логического вывода. С их помощью возможно производить вычисления необходимых логических параметров, а также выполнять автоматизированную проверку корректности онтологической модели с целью последующего внедрения в нее дополнительных данных в полном соответствии с установленными правилами.
- Правила логического вывода SWRL. С его помощью становится возможным получить доступ к определению самостоятельных правил, в рамках которых должны формироваться определенные выводы. Существенных практических достижений в данном направлении пока что нет, однако незначительное продвижение намечается.
- OWL API. Данный интерфейс дает возможность непосредственным образом получать доступ к работе с имеющимися базами триплетов и машин логического вывода из Java-приложений на программном уровне [3].
В настоящее время существует достаточно большое число разнообразных автоматизированных инструментов, которые позволяют создавать онтологические модели, исходя из имеющихся данных. К числу наиболее известных из них, на 2021 год, можно перечислить:
– DBpedia;
– Yago + wordnet.princeton.edu;
– WikiData;
– BioPortal;
– Bio2RDF;
– PubMed;
– Protégé, который получил наибольшую популярность в современное время.
В настоящее время одной из перспективных задач выступает создание и последующее внедрение в практику современных корпоративных порталов. К числу наиболее эффективных методов его создания относится использование предметно-объектных моделей. Однако в данном случае имеется ряд проблемных вопросов, для эффективного решения большинства из которых является применение в процессе разработки и последующей практической реализации онтологических моделей. С их помощью создаются онтологические модели предметной сферы посредством применения технологии машины и правил логического вывода, с помощью которой формируется пользовательский интерфейс. Подобное решение приводит к существенному сокращению данных и вероятности их дублирования.
Конечно, важно отметить, что существуют определенные противоречия между данными моделями (объектной и онтологической). В частности, для хранения онтологических данных необходимо присутствие их унифицированного описания, в то время как в объектной модели, применяемой для практической реализации, является оптимизированной, исходя из унификации отображения данных. Данный подход нашел свое отражение в процессе создания систем, в которых хранится онтология, построенных на базе триплетов. В таких системах базовым элементов унификации выступает непосредственно сам триплет, а для описания применяется язык RDF. Несомненно, что в данной ситуации (совместном применении двух моделей) сохранение данных потребует достаточно большого количества различных преобразования в ходе объектно-реляционного преобразования, что, в конечном итоге, приведет к достаточно сильному усложнению слоя обработки данных.
Однако подобного рода недостатки являются незначительными и применение объектно-ориентированной модели в качестве промежуточной модели представляется обоснованным. Представление онтологии с помощью объектно-ориентированной модели означает моделирование онтологии методами объектно-ориентированного моделирования, организацию хранения онтологии в виде набора объектов и управление онтологией, реализованное как управление объектно-ориентированной моделью [5].
В заключение работы хотелось бы отметить, что использование онтологических моделей данных в современных информационных технологиях является одним из наиболее перспективных направлений, которое позволяет добиться достаточно больших успехов. Разработанные на основе данной модели современные технологии могут эффективно работать вместе, тем самым их достаточно легко интегрировать в любую современную область. Работа с подобного рода моделями в настоящее время может проводиться различными инструментами, среди которых наибольшей популярностью пользуется Protégé, который в течение нескольких последних лет получил широкое признание у пользователей. Все это, несомненно, позволяет говорить о необходимости продолжения работы с онтологическими моделями и выполнении дополнительных научных и исследовательских работ в данной сфере, которые помогут расширить имеющиеся знания и открыть новые возможности работы с онтологической моделью.
Литература:
- Черников, Б. В. Лексикологический синтез документов в комплексах информационных систем: монография / Б. В. Черников. — М.: Инфра-М, 2018. — 336 с.
- Маслов, В. А. Обработка семантических запросов в среде Protégé на примере построения онтологии дорожных знаков / В. А. Маслов, С. М. Соколов. — М.: ИПМ им. М. В. Келдыша, 2018. — 15 с.
- Горшков, С. Введение в онтологическое моделирование / С. Горшков. — М.: ТриниДата,2018. — 150 с.
- Применение онтологии к решению практических задач ИБ (часть 1) [Электронный ресурс]. Свободный доступ: https://habr.com/ru/post/659425 (дата обращения — 16.06.2022 г.).
- Грегер, С. Э. Совместное использование онтологической модели и объектной моделей при проектировании и реализации информационных web-систем