Для ефективної роботи зі сховищем даних, необхідно зібрати максимум інформації про процес. Наприклад, для прогнозування обсягів продажів можуть бути використані бази даних облікових систем компанії, маркетингові дані, відгуки клієнтів, дослідження конкурентів і т.п.
Необхідною для прогнозу є наступна інформація:
o хронологія продажів;
o стан складу на кожний день - якщо спад продажів буде пов'язаний із відсутністю товару на складі, а не через відсутність попиту;
o відомості про ціни конкурентів;
o зміни у законодавстві;
o загальний стан ринку;
o курс долара, інфляція;
o відомості про рекламу;
o відомості про відношення до продукції клієнтів;
o різного роду специфічну інформацію. Наприклад, для продавців морозива - температуру, а для фармакологічних складів -санітарно-епідеміологічний стан, тощо.
Проблема полягає в тому, що зазвичай в системах оперативного обліку більша частина цієї інформації відсутня, а наявна - неповна або спотворена. Кращим варіантом в цьому випадку буде створення сховища даних, куди б з певною заданою періодичністю надходила вся необхідна інформація, заздалегідь систематизована і очищена (рис.5.1).
Рис.5.1. Приклад сховища даних
Ефективна архітектура сховища даних організовується таким чином, щоб бути складовою частиною інформаційної системи управління підприємством.
Найбільш поширений випадок, коли сховище організовано за типом "зірка", де в центрі розміщуються факти і агрегатні дані, а "проміннями" є виміри. Кожна "зірка" описує певну дію, наприклад, продаж товару, його відвантаження, надходження коштів й інше:
Рис.5.2. Схема організації сховища даних за типом "зірка"
Як правило, дані копіюються в сховище з оперативних баз даних і інших джерел відповідно до певних правил.
5.2. Технологія аналітичної обробки даних в реальному часі OLAP
OLAP (On-Line Analytical Processing) є ключовим компонентом організації сховищ даних. Ця технологія заснована на побудові і візуалізації багатовимірних кубів даних з можливістю довільного маніпулювання даними, що містяться в кубі (рис.5.3). Це дозволяє представити дані для аналізу в будь-якому розрізі.
Повернемося, наприклад, до аналізу продажів. Припустімо, що керівнику необхідно знати обсяги продажів за деякий період, (наприклад, за місяць), що нещодавно завершився. При цьому, компанія продає не один, а множину товарів і має велику кількість торгівельних точок (ТТ) -магазинів.
Сторінки
В нашій електронній бібліотеці ви можете безкоштовно і без реєстрації прочитати «Інформаційні технології та моделювання бізнес-процесів» автора Томашевський О.М. на телефоні, Android, iPhone, iPads. Зараз ви знаходитесь в розділі „5. Створення сховищ даних. Технології OLAP та Data Mining“ на сторінці 4. Приємного читання.