Предложен подход к автоматизированному получению метрических характеристик физических схем баз данных на основе концептуальных графов.
Ключевые слова: метрическая характеристика, база данных, концептуальный граф, физическая схема.
База данных является ядром информационной системы. Применение рассчитанных количественных метрических характеристик физических схем баз данных (БД) позволяет разработчикам БД [1, 3, 4]:
- изучить сложность разработанной физической схемы базы данных;
- оценить объем работ, выполненных разработчиком физической схемы БД;
- оценить усилия по реализации физической схемы БД;
- выбрать наилучшую физическую схему БД из нескольких альтернативных вариантов.
В настоящее время актуальной является задача измерения количественных метрик физических схем БД.
Расчет метрических характеристик рассмотрим для наиболее распространенной СУБД MySQL, используемой при проектировании веб-ориентированных информационных систем любой сложности [2].
Количественные метрики, которые используются в работе можно разделить на три категории:
1. для таблиц: количество атрибутов, количество внешних ключей, глубина дерева связей, коэффициент внешних связей;
2. для физической схемы: количество таблиц схемы, количество атрибутов схемы, связность схемы, количество внешних ключей схемы, глубина дерева связей схемы, коэффициент внешних связей схемы;
3. для концептуального графа физической схемы: порядок графа, размер графа, диаметр графа, структурная избыточность графа, реберная плотность графа, абсолютная глубина графа, средняя глубина графа.
Метрические характеристики первых двух категорий рассчитываются путем выполнения запросов к служебной БД MySQL, что является преимуществом, т. к. нет необходимости анализировать SQL — скрипт БД.
Для удобства представления физической схемы БД, разработанное программное средство позволяет визуализировать ее в виде концептуального графа. В качестве средства визуализации физической схемы БД в виде концептуального графа была использована библиотека Cytoscape Web.
Рассмотрим разработанное программное средство автоматизированного расчета метрических характеристик физических схем баз данных на основе концептуального графа. На рисунке 1 представлена структурная схема программного средства (ПС).
Рис. 1. Структурная схема ПС
Приведем описание выделенных модулей разработанного программного средства.
В основе модуля построения концептуального графа схемы БД лежит использование библиотека Cytoscape Web. На ее вход подается список вершин и список дуг концептуального графа. Список вершин и список дуг формируется в результате выполнения SQL-запросов к служебной базе данных MySQL INFORMATION_SCHEMA.
Модуль расчета метрических характеристик для таблиц БД, выполняя запросы к базе данных INFORMATION_SCHEMA, рассчитывает метрические характеристики для таблиц баз данных. А также использует алгоритм нахождения глубины дерева связей для таблиц БД.
Модуль расчета метрических характеристик физической схемы БД выполняет запросы к базе данных INFORMATION_SCHEMA и рассчитывает метрические характеристики физических схем баз данных. Помимо запросов, данный модуль использует алгоритм нахождения связности схемы БД.
Модуль расчета метрических характеристик концептуального графа физической схемы БД работает с матрицей смежности концептуального графа физической схемы БД. На основе матрицы смежности рассчитываются метрические характеристики концептуального графа физической схемы БД.
Модуль расчета статистики для метрических характеристик физических схем БД рассчитает статистику для метрических характеристик таблиц физических схем баз данных:
- среднее значение;
- минимальное значение;
- максимальное значение;
- стандартное отклонение.
В основе модуля формирования отчетов используется библиотека PHPWord. С помощью этой библиотеки создается текстовый файл в формате docx, в который сохраняются все рассчитанные метрические характеристики физической схемы базы данных.
На рисунке 2 представлен интерфейс ПС после запуска.
Рис. 2. Интерфейс программного средства
Программное средство работает с установленными базами данных. Поэтому все базы данных, установленные на сервере MySQL, перечисляются в списке. После выбора базы данных из списка строится концептуальный граф ее физической схемы (рисунок 3). Для примера используется физическая схема веб-ориентированной информационной системы «Гостиница».
Рис. 3. Визуализация концептуального графа физической схемы БД
Для удобства сравнения концептуальных графов физических схем баз данных предусмотрено отображение графа в виде круговой диаграммы.
Правила просмотра метрических характеристик таблиц физической схемы БД представлены на рисунке 4.
Рис. 4. Просмотр метрических характеристик таблиц
Интерфейс просмотра метрических характеристик физической схемы базы данных представлен на рисунке 5.
Рис. 5. Просмотр метрических характеристик физической схемы БД
Интерфейс просмотра метрических характеристик концептуального графа физической схемы базы данных представлен на рисунке 6.
Рис. 6. Просмотр метрических характеристик концептуального графа физической схемы БД
Интерфейс просмотра статистики для метрических характеристик таблиц физических схем баз данных представлен на рисунке 7.
Рис. 7. Просмотр статистики для метрических характеристик таблиц
После расчета всех метрических характеристик формируется отчет в формате docx. Пример отчета представлен на рисунке 8.
Рис. 8. Пример отчета
Разработанное программное средство автоматизированного расчета метрических характеристик физических схем баз данных на основе концептуальных графов позволяет рассчитывать количественные метрические характеристики физических схем баз данных на основе концептуальных графов. Рассчитанные метрические характеристики могут быть использованы в алгоритмах нахождения сложности физической схемы БД, а также при поиске закономерностей изменения метрических характеристик.
Литература:
1. Кузьмин А. А., Рыбанов А. А. Исследование методов количественной оценки схем реляционных баз данных // Успехи современного естествознания. 2011. № 7. С. 137–138.
2. Рыбанов А. А., Морозов А. О. Обзор количественных метрик физических схем баз данных // Информатика и информационные технологии в образовании, науке и производстве: сб. науч. ст. Ч. I / Издательство научной литературы Нобель Пресс. — [Волжский], 2014. — C. 152–158.
3. Утицких И. А., Рыбанов А. А. Анализ физических схем реляционных баз данных [Электронный ресурс]: доклад // Студенческий научный форум 2013: V междунар. студ. электрон. науч. конф., 15 февр. — 31 марта 2013 г. Направл. <<Технические науки>> / Рос. акад. естествознания. — М., 2013. — С. 1–4. — Режим доступа: http://www.scienceforum.ru/2013/pdf/4553.pdf.
4. Утицких И. А., Рыбанов А. А. Исследование метрических характеристик физических схем реляционных баз данных // Девятнадцатая межвузовская научно-практическая конференция молодых учёных и студентов, г. Волжский, 27–31 мая 2013 г.: тез. докл. / Филиал МЭИ в г. Волжском. — Волжский, 2013. — C. 39–41.