Approaches to converting relational databases into knowledge

UDC 685.34
Publication date: 01.03.2021
International Journal of Professional Science №3-2021

Approaches to converting relational databases into knowledge

Подходы к преобразованию реляционных баз данных в базы знаний

Maximenko Alexander N.
Kostyleva Valentina V.
Razin Igor B.

1. postgraduate student
A. N. Kosygin Russian State University (Technology. Design. Art)
2. DSc in technical Sciences, Professor,
A. N. Kosygin Russian State University (Technology. Design. Art)
3. PhD in Technical Sciences, associate Professor,
A. N. Kosygin Russian State University (Technology. Design. Art)


Максименко Александр Николаевич
Костылева Валентина Владимировна
Разин Игорь Борисович

1. аспирант
РГУ им. А. Н. Косыгина (Технологии. Дизайн. Искусство)
2. доктор технических наук, профессор,
РГУ им. А. Н. Косыгина (Технологии. Дизайн. Искусство)
3. кандидат технических наук, доцент,
РГУ им. А. Н. Косыгина (Технологии. Дизайн. Искусство)
Аннотация: Переход от данных к знаниям — следствие развития и усложнения информационно-логических структур, обрабатываемых с помощью компьютера. Цель исследования состоит в преобразовании реляционных баз данных в базы знаний. В статье рассмотрены концепции и технологии разработки реляционных баз данных и баз знаний. Изложены подходы и инструменты к преобразованию реляционной базы данных в граф онтологии, а также научные исследования в области сравнения и объединения данных. Представлены результаты построения онтологии протезно-ортопедических изделий и средств реабилитации. Такой подход разрабатывается в рамках диссертации на соискание ученой степени кандидата технических наук Максименко А.Н. и предполагается к внедрению в учебный процесс кафедр «Художественное моделирование, конструирование и технология изделий из кожи», «Информационные технологии» РГУ им. А.Н. Косыгина (Технологии. Дизайн. Искусство) в виде учебных пособий.

Abstract: The transition from data to knowledge is a consequence of the development and complexity of information and logical structures processed by a computer. The purpose of the study is to transform relational databases into knowledge bases. The article discusses the concepts and technologies for the development of relational databases and knowledge bases. Approaches and tools for transforming a relational database into an ontology graph are described, as well as scientific research in the field of data comparison and aggregation. The results of constructing an ontology of prosthetic and orthopedic products and rehabilitation tools are presented. This approach is developed within the framework of the Maximenko A. N. PhD dissertation and is supposed to be introduced into the educational process of the departments «Art Modeling, design and Technology of leather products», «Information Technologies» of the A. N. Kosygin Russian State University (Technology. Design. Art) in the form of textbooks.
Ключевые слова: реляционная база данных, модели баз знаний, онтология, протезно-ортопедические изделия, средства реабилитации

Keywords: relational database, knowledge base models, ontology, prosthetic and orthopedic products, rehabilitation means


Введение. В настоящее время реляционные базы данных являются популярным инструментом для хранения данных в инженерных, производственных и коммерческих информационных системах [1]. Наряду с этим, известен проверенный подход к организации обработки и хранения знаний на основе технологий онтологического анализа знаний о предметной области [2-3]. Информационные системы с интегрированной семантикой предметной области привлекательны в решении задач контроля корректности структуры нормативно-справочной информации, повышения степени достоверности данных и их аккумуляции из различных источников в единый информационный фонд.

Реляционная модель данных. Реляционная база данных представляет собой массив файлов, который служит для хранения данных в информационной системе. Основными элементами реляционной модели являются [4]:

–   отношения, которые имеют графическую интерпретацию в виде таблицы;

–   атрибуты, которые можно рассматривать как столбцы таблицы. Каждый атрибут принадлежит конкретному отношению. Минимальный набор атрибутов, которые однозначно определяют элемент отношения (кортеж, т.е строку в таблице) является потенциальным ключом для этого отношения. В случае, если существует более одного потенциального ключа, один из них назначается в качестве первичного и используется для идентификации этого отношения. Внешним ключом называется «отношение — родитель», представляющее собой набор атрибутов, которое ссылается на кортеж в другом отношении называемом «отношение — потомок»;

домены, представляющие собой наборы постоянных значений. Каждый атрибут связан с определенным доменом и все его значения являются элементами этого домена (рис 1).

Рисунок 1. Схема модели реляционной базы данных, где

R: отношение – родитель; Q: отношение-потомок; R (att1, att2…attn), Q (att1, att2…attn): атрибуты отношений; (t1, t2…ti): кортежи; ti: домен

Стандартный процесс проектирования баз данных состоит из трех этапов: а) концептуального, б) логического и в) проектирования физической модели базы данных. Переход от концептуальной модели к логической выполняется по хорошо отработанным стандартным алгоритмам [5], которые определяют соответствия между элементами моделей. Преобразование концептуальной модели в логическую реляционную представляет собой нереверсивный процесс, что является предметом обратного проектирования баз данных, т. е. восстановления исходной концептуальной модели из логической.

Онтологическая модель представления знаний. Принципиально другая концепция определяет сущность способа структуризации информации на основе методов разработки моделей знаний или онтологий. Согласно [6], онтология – это набор элементов, содержащих:

  • набор понятий (терминов) предметной области;
  • совокупность отношений между понятиями, описанных в рамках ограничения домена;
  • таксономию понятий с множественным наследованием;
  • таксономию отношений с множественным наследованием;
  • набор аксиом, которые описывают дополнительные ограничения онтологии и позволяют выводить новые факты из уже явно заявленных (рис.2).

Рисунок 2. Схема модели онтологии предметной области

Подходы к преобразованию реляционных баз данных в базу знаний. Элементарный подход преобразования реляционной базы данных в граф онтологии предложен Тимом Бернерсом-Ли [7], и, несмотря на всю простоту, он является основой многих методов разработки онтологий. Согласно этому подходу:

  1. Каждое отношение R сопоставляется с классом P (Rn);
  2. Каждый кортеж отношения R сопоставляется с узлом онтологии типа C (R);
  3. Каждый атрибут отношения R сопоставляется со свойством P (att);
  4. Для каждого кортежа R[t], значение атрибута att сопоставляется со значением свойства P (att) для узла, соответствующего кортежу R[t].

Этот подход применим к любому экземпляру реляционной базы данных, и в значительной степени может быть автоматизирован. Однако, в результате экспорта реляционной  базы данных, согласно этому подходу, получается упрощенная онтология, похожая на копию схемы базы данных [8]. Методы, совершенствующие и развивающие базовый подход, допускают более сложные преобразования, позволяют обнаружить семантически значимую информацию в структуре реляционной базы данных.

Основу разделения подходов к преобразованию реляционных баз данных и онтологий составляют  следующие принципы:

  • Интеграции информации из реляционной базы данных в существующую онтологию;
  • Создания новой онтологии из экземпляра реляционной базы данных.

В первом случае, онтология должна моделировать предметную область схожую с областью базы данных. По этой причине, онтология для интеграции подбирается экспертом, которому известно смысловое содержимое базы данных. Для подходов, которые из реляционной базы данных создают новую онтологию, наличие базовой онтологии для интеграции базы данных не является обязательным условием. Эти методы допускают экспорт данных без участия эксперта, т.е в автоматизированном режиме.

По уровню автоматизации подходов выделяют: автоматические, полуавтоматические и выполняемые с участием эксперта. Подходы, выполняемые с участием эксперта, по определению захватывают истинный смысл логической схемы реляционной базы данных, тогда как чисто автоматические инструменты редко могут достичь высокого уровня интерпретации семантически значимых данных.  Это происходит главным образом потому, что эксперт — самый надежный источник семантики при экспорте схемы базы данных.

Инженерные и бизнес системы должны опираться на эталонную модель знаний, содержащие четкие и однозначные сведения о предметной области [9]. При разработке онтологий для промышленных, коммерческих секторов предпочтительным подходом для преобразования реляционных баз данных к системам баз знаний на основе онтологий является экспертный подход.

Ранее разработано несколько инструментов преобразования баз данных в онтологию предметной области на основе экспертного подхода:

  • MASTRO [10];
  • METAmorphoses [11];
  • OntoAccess [12].

Фреймворк MASTRO выполняет сопоставление реляционной базы данных и онтологии, используя конъюнктивные запросы. Фреймворк MASTRO – это набор инструментов доступа к содержимому онтологий, который переформулирует конъюнктивный запрос на языке DL-Lite в SQL-запрос понятный реляционной базе данных. MASTRO дополнен плагином OBDA для популярного редактора онтологий Protégé. Плагин отображает преобразования между базой данных и онтологией средствами графического интерфейса.

Приложение METAmorphoses использует двухуровневую архитектуру для генерации графа онтологии, может задействовать термины и понятия из других популярных онтологий. Первый уровень приложения преобразует данные на языке XML. На втором уровне пользователь может указать точный вывод графа онтологии в терминах другого языка на основе XML, повторно используя определения из первого уровня.

Подход, реализованный в приложении OntoAccess, вводит язык сопоставления R3M для генерации графа онтологии из реляционной базы данных. Подход OntoAccess сосредоточен вокруг оперативного обновления онтологии динамически изменяющимися сведениями из реляционной базы данных, однако поддерживает только тривиальные отношения между классами, атрибутами и связями между отношениями.

Дать общую оценку предложенных решений очень сложно, если вообще возможно, в виду их функциональных различий. В целом, эти решения являются общедоступным программным обеспечением, достигшим определенного уровня зрелости с активной поддержкой разработчиков.

Выводы. Нами разработана онтология предметной области протезно-ортопедических изделий и средств реабилитации подробная формализация которой должна быть осуществлена из баз данных поставщиков сырья, фирм-производителей, ритейлеров при помощи инструментов преобразования реляционных баз данных в базы знаний, предложенных выше.

Фрагмент онтологии протезно-ортопедических изделий и средств реабилитации представлен на рис. 3.

Семантическая идентификация ключевой информации о протезно-ортопедических изделиях и средствах реабилитации может быть эффективно проведена в соответствии с минимальным набором понятий, предложенных в работе [9]. Классификации изделий предложены в работе [13].

Рисунок 3. Фрагмент онтологии протезно-ортопедических изделий и средств реабилитации

Онтология рекомендуется в качестве модуля электронного каталога изделий медицинского назначения, представленного нами ранее [13, 14], и призвана повысить эффективность снабжения населения реабилитационными изделиями и услугами.

References

1. D.-E.Spanos, P.Stavrou, N. Mitrou Bringing Relational Databases into the Semantic Web: A Survey, Semantic Web 0 (0) 1–41;
2. Antoniou, G. and van Harmelen, F., A Semantic Web Primer, The MIT Press, Cambridge, Massachusetts, 2004, pp. 109–146.
3. Steve Ray, Interoperability Standards in the Semantic Web Journal of Computing and Information Science in Engineering · January 2002
4. E. F. Codd, A Relational Model of Data for Large Shared Data Banks, Communications of the ACM, 13(6), pp. 377–387, 1970.
5. R. Elmasri, S. B. Navathe, Fundamentals of Database Systems, The Benjamin/Cummings Publishing Company, Inc., San Francisco, CA, USA, 6th ed., 2010.
6. A. Maedche, S. Staab, Ontology Learning for the Semantic Web, IEEE Intelligent Systems, 16(2), pp. 72–79, 2001.
7. T. Berners-Lee, Relational Databases on the Semantic Web, available at: http://www.w3.org/DesignIssues/RDB-RDF.html, 1998.
8. K. Byrne, Having Triplets - Holding Cultural Data as RDF in M. Larson, K. Fernie, O. J. and J. Cigarran, eds., Proceedings of the ECDL 2008 Workshop on Information Access toCultural Heritage, 2008.
9. А.Н. Максименко, В.В. Костылева, И.Б. Разин Компьютерные сети как инструмент поиска и подбора технических средств реабилитации // М.: ИИЦ РГУ им. А.Н. Косыгина. Дизайн и технологии 2019, № 71 (113). с. 84-90
10. D. Calvanese, G. De Giacomo, D. Lembo, M. Lenzerini, A. Poggi, M. Rodriguez-Muro, R. Rosati, M. Ruzzi and D. F.Savo, The MASTRO System for Ontology-based Data Access, Semantic Web Journal, 2(1), pp. 43–53, 2011.
11. M. Svihla and I. Jelinek, Two Layer Mapping from Database to RDF, in Proceedinfs of the Sixth International Scientific Conference Electronic Computers and Informatics (ECI 2004), pp. 270–275, 2004
12. M. Hert, G. Reif and H. C. Gall, A Comparison of RDB-to-RDF Mapping Languages, in C. Ghidini, A.-C. Ngonga Ngomo, S. Lindstaedt and T. Pellegrini, eds., Proceedings of the 7th International Conference on Semantic Systems (I-SEMANTICS 2011), pp. 25–32, ACM, 2011.
13. А.Н. Максименко, В.В. Костылева, И.С. Зак, И.Б. Разин IT-технологии в обеспечении населения протезно-ортопедическими изделиями и средствами реабилитации// М.: ИИЦ МГУДТ. Дизайн и технологии 2018, № 63 (105) – c. 25-30
14. А.Н. Максименко, В.В. Костылева, И.С. Зак, И.Б. Разин Концепция построения интернет-площадки протезно-ортопедических изделий и средств реабилитации [Текст] // М.: ИИЦ МГУДТ. Дизайн и технологии 2017,№59(101) с. 30-35