Введение в BI-технологии | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 28 декабря, печатный экземпляр отправим 1 января.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №3 (83) февраль-1 2015 г.

Дата публикации: 01.02.2015

Статья просмотрена: 1201 раз

Библиографическое описание:

Самойлова, И. А. Введение в BI-технологии / И. А. Самойлова. — Текст : непосредственный // Молодой ученый. — 2015. — № 3 (83). — С. 78-80. — URL: https://moluch.ru/archive/83/15330/ (дата обращения: 19.12.2024).

Историю возникновения термина «business intelligence» (BI) связывают с работами американского ученого Ханса Петера Луна. В 1958 году он опубликовал работу, в которой описал системы, обеспечивающие взаимодействие различных видов деятельности в бизнесе (разумная деятельность — intelligence system). Эти теоретические работы намного опередили свое время и были вновь востребованы в конце 80-х годов. Аналитик Ховард Дреснер тогда предложил использовать BI в качестве «термина для различных технологий, предназначенных для поддержки принятия решений». В 1996 году определение BI уточнили — «инструменты для анализа данных, построения отчетов и запросов, которые помогают бизнес-пользователям преодолеть море данных для выделения из них значимой информации» [1].

Но даже сейчас нет однозначного определения что же такое BI (business intelligence). Большинство современных определений трактуют это понятие как процессы, методы, средства получения и представления знаний.

Для организации хранения информации и получения знаний чаще всего применяют хранилища данных, а для получения этих знаний пользователю — различные инструменты BI. Количество данных постоянно увеличивается, поэтому из-за больших объемов информация не совсем подходит для принятия решений без определенных средств извлечения и обработки. Средства BI и хранилища данных предназначены находить, упорядочивать, предоставлять запрошенную информацию из массивов данных, человеку для принятия конкретного решения.

И так, Business intelligence включает в себя:

-          процесс обработки данных в информацию и получения знаний для принятия решений;

-          информационные технологии сбора, хранения данных, слияние информации и обеспечение доступа пользователей к этим знаниям;

-          знания о бизнес-процессах, полученные в результате анализа и консолидирования информации.

Рассмотрим архитектуру BI (рис.1).

Рис.1.Схема BI архитектуры

 

Data sources — источники данных для базы данных (БД):

-        CRM (Customer Relationship Management) — специальные приложения, пакеты для управления взаимодействием с клиентами.

-        ERP (Enterprise Resource Planning) — система для планирования ресурсов предприятия. Сюда входит стратегия интеграции производства и операций управления трудовыми ресурсами, финансового менеджмента и управления активами, обеспечивающего общую модель данных и процессов для всех сфер деятельности предприятия. ERP-система — это некий программный пакет, реализующий стратегию ERP.

-        SCM (Supply Chain Management) — управление цепями поставок — интегрированный подход к планированию и управлению всем потоком информации о сырье, материалах, продуктах, услугах, возникающих и преобразующихся в логистических и производственных процессах предприятия, нацеленном на измеримый совокупный экономический эффект (снижение издержек, удовлетворение спроса на конечную продукцию).

-        Внешние массивы данных и другие источники

Data Warehouse (хранилище данных) — предметно-ориентированная информационная БД, специально разработанная и предназначенная для подготовки отчётов и бизнес-анализа для поддержки принятия решений в организации. Данные из OLTP-системы копируются в хранилище данных таким образом, чтобы при построении отчётов и OLAP-анализе не использовались ресурсы транзакционной системы и не нарушалась её стабильность.

Существует два способа обновления данных в хранилище [2]: захват данных и репликация. Первый способ позволяет полностью обновить данные в хранилище, при этом старые данные удаляются и загружаются новые. При втором способе обновляются только те данные, которые изменились в OLTP-системе. Чаще всего это оn-line обновление данных.

OLTP-система («Online Transaction Processing») — обработка транзакций в реальном режиме. Здесь система работает с небольшими по размерам транзакциям, которые идут большим потоком, при этом пользователю необходимо от системы минимальное время отклика.

OLAP-анализ («OnLine Analytical Processing») — технология обработки данных для подготовки объединенной информации, полученной из больших массивов данных.

ETL («Extract — Transform — Load») — один из основных процессов в управлении хранилищами данных, включающий извлечение данных, их преобразование и очистку, а также загрузку этих данных в хранилища.

Мета-данные — это данные о данных, информация об информации, описание контента. Структурированные данные представляют собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки, управления ими.

MDM («Master Data Management») — совокупность процессов и инструментов для постоянного определения и управления основными данными компании (в том числе справочными). Применяется и другой термин — RDM («Reference Data Management»), управление справочными данными.

Data Mart (витрина данных) — подготовленный срез данных, представленный в виде массива узконаправленной информации, ориентированной, например, на запрос пользователя.

«BI» Analytics — это BI-продукты для обработки и предоставления данных пользователю.

За сравнительно небольшое время информационно-аналитические системы (EIS — «Еxecutive information systems») прошли эволюцию от информационных систем (ИС) руководителя к системам поддержки принятия решений (DSS — «Decision support systems»), а затем и к современным системам бизнес-интеллекта. Эта эволюция напрямую связана с развитием техники.

В эпоху развития больших ЭВМ и первых ПК, большинство пользователей не имели прямого доступа к данным. Пользователи заказывали стандартные или заранее созданные параметрические отчеты у своих IT-подразделений. При возникновении нестандартных запросов необходимо было предварительно заказывать их разработку.

EIS-приложения позволяли руководителям и менеджерам получать основную информацию о бизнесе в виде отчетов-таблиц или диаграмм. Обычно это были параметризированные запросы к данным предприятия. В основном такое ПО разрабатывалось IT-подразделениями предприятия. При появлении дополнительной информации для ее обработки писалось новое приложение или дорабатывалось старое.

Приложения DSS — это обычно пакеты прикладных программ с динамической генерацией SQL-скриптов на основе запроса пользователя. Они позволяли получить информацию из БД, не требуя знания SQL. DSS позволяют получить много вариантов представления данных, но гибкость таких приложений ограничена из-за реализации для конкретного набора данных и задач.

Сейчас, с развитием информационных сетей, приложения строятся на основе BI и позволяют пользователю оперативно извлекать информацию из различных источников, настраивать собственные отчеты, производить глубокий анализ данных. Развитие BI-систем пришло к созданию Web-приложений. Пользователь имеет доступ к данным через браузер и может работать удаленно с любого места. Чаще всего пользователи BI находятся внутри локальной корпоративной сети. Но сами технологии позволяют осуществить подключение внешних пользователей и создание систем для всех пользователей Internet.

Технология BI неразрывно связана с технологиями хранения данных [2]. Реализация хранилища данных определяет методы сбора, хранения, очистки и интеграции информации, предназначенной для анализа. Технология BI определяет методы, а так же средства доступа для анализа информации в терминах соответствующей предметной области. BI-средства не обязательно должны работать с хранилищем данных, но тогда все проблемы согласования данных возлагается на них. Желательно осуществлять эти операции на лету (on-the-fly), обеспечивая надежность системы обработки транзакций. Поэтому хорошим решением является разделение транзакционной и аналитической частей. Стыковка систем идет не только на уровне информации, но и на уровне мета-данных. В случае хранилища данных можно обеспечить централизованное управление мета-данными.

Прогнозируется, что в ближайшем будущем все большее распространение получат сети бизнес-интеллекта (BI Networks), использующие такие возможности, как [4]:

1.                  XML/A(XML для анализа) — в настоящее время пока имеет большие проблемы производительности и пока применяется лишь для «облегченного» OLAP-клиента. Если эта проблема будет решена, то XML/A возможно сможет стать языком общения между разными BI-средами.

2.                  Web-сервисы BI. Новые продукты EBIS часто идентифицируют как BI-порталы, так как эти продукты для Web обеспечивают точку доступа к корпоративным данным. Ориентированная на сервисы, новая архитектура SOA является современным развитием серверов приложений и корпоративных порталов.

3.                  Беспроводные и мобильные коммуникации. Еще одна тенденция по доставке BI-информации просматривается у поставщиков, предоставляющих возможность при помощи BI-продуктов доставлять отчеты посредством мобильной технологии: персональных электронных помощников (PDA), Internet-телефонов и т. п.

4.                  Совместная работа. Разделение результатов анализа на несколько пользователей и добавление аннотаций к отчетам (Workflow) было и в EIS, но сейчас эта функциональность добавлена и во многие BI-приложения. Много пользователей смогут работать одновременно с одной моделью данных при обеспеченной связи разных BI-приложений в реальном времени.

5.                  Средства мониторинга бизнес-деятельности («Business activity monitoring»). Новая технология BAM сочетает в себе интеграцию приложений реального времени с возможностями BI. Используя исходные данные, BI-инструменты анализируют их и выдают предупреждения о важных событиях и информацию пользователям, принимающим непосредственные решения управления.

Cлишком быстрые изменения в BI-технологии, использование непроверенных решений и средств на сегодня является риском. Необходимо отслеживать поставщиков, оценивать их устойчивость, направления развития, регулярно пробовать новые средства, проводить типизацию и унификацию «business intelligence».

 

Литература:

 

1.         Корнеев В. В., Гареев А. Ф., Васютин С. В., Райх В. В. Базы данных. Интеллектуальная обработка информации. — М.: Нолидж, 2001.

2.         Спирли Э. Корпоративные хранилища данных. Планирование, разработка, реализация. Том.1: Пер. с англ. — М.: Вильямс, 2001

3.         http://www.osp.ru

4.         http://www.tadviser.ru

Основные термины (генерируются автоматически): DSS, XML, данные, хранилище данных, EIS, ERP, пользователь, BAM, CRM, реальное время.


Задать вопрос