Проблемні питання розробки і реалізації Geospatial Business Intelligence

Концепція, технологія і засоби  Geospatial Business Intelligence засновані на комплексуванні hi-tech функцій Business Intelligence та Geographic Information System (GIS) – геопросторових інформаційних систем (ГІС) [1, 2]. У теперішній час процес цього комплексування знаходиться на етапі становлення, концентруючись на нетривіальній обробці й візуалізації інформації, яка міститься в GIS.  Існують також конкуруючі терміни. Провідні у світі консалтингові компанії Gartner, Forrester, IDС та незалежні аналітики [3-6] розглядають Business Intelligence як життєво важливу технологію забезпечення більш осмислених, гнучких й ефективних рішень і на протязі останніх п’яти років ставлять у першу п’ятірку 10-ти найактуальніших інформаційних технологій [3].

Geospatial Business Intelligence реалізується у різних комерційних і некомерційних сферах діяльності. Так, на сторінках National Geospatial-Intelligence Agency (Національного Агенства Геопросторової Розвідки) США в Інтернеті встановлені гіперпосилання на сторінки з Geospatial Business Intelligence [7]. У 2010 р. керівником агенства вперше в історії співтовариства розвідувальних органів США призначена жінка (цивільний фахівець), що, ймовірно, свідчить про перехід до активнішого використання технологій подвійного призначення, у тому числі у сфері попередження населення про стихійні лиха, тощо.

У Збройних силах США у 2005 р. створено U.S. Army Enterprise Solutions Competency Center (Центр компетенції  корпоративних рішень). Центр випустив довідкове керівництво з Army Business Intelligence та інші [7]. У документі показано, що у 21-му столітті у сфері обробки інформації наступив третій етап – Business Intelligence Age (ера Business Intelligence). Зазначимо, що термін Business Intelligence у його теперішньому тлумаченні запропонував у 1989 р. Hovard Dresner, який з цього часу почала підтримувати компанія  Gartner; у цьому ж році Григорій Пятецький-Шапіро (Gregory Piatetsky-Shapiro) провів перший семінар з Knowledge Discovery in Databases (відкриття знань у базах даних), складовою частиною чого є Data Mining, які є важливою складовою Business Intelligence.

Отже, актуальним завданням є аналіз шляхів використання Geospatial Business Intelligence (має подвійне призначення).

Business Intelligence  –  термін-метафора, який не має дослівного перекладу й однозначного тлумачення і використовується як узагальнене позначення ієрархічно-синергетичного комплексу концепцій, технологій і засобів глибинної обробки первинної інформації для підтримки прийняття рішень. Основними складовими у найпростішому випадку є сховище даних (Data Warehouse) з кіосками й вітринами даних (Data Marts), засоби формування регламентованих запитів і звітів, OLAP, Data Ming, засоби статистичного аналізу та спеціальні засоби візуалізації добутих знань із даних. Сформована нова генерація Business Intelligence, яку часто відзначають  індексом «2.0». У [9] розглянуті особливості цього процесу та запропонована удосконалена узагальнена архітектура системи підтримки прийняття рішень (Desicion Support System  Business Intelligence 2.0, DSS BI 2.0). Засоби OLAP у DSS BI 2.0 запропоновано реалізувати на основі розширеного тесту FASMI+ (OLAP+), до якого інтегровані вимоги до знань [10]. Це визначає необхідність реалізації в OLAP базових функцій експертних систем.

Далі розглянуті деякі проблемні науково-прикладні питання, що потребують розв’язання при створенні програмних комплексів Geospatial Business Intelligence та запропоновані шляхи їх вирішення.

1. Багато складнощів створюють неточні переклади і тлумачення базових термінів у даній сфері, для прикладу, Business та Intelligence. Неврахування особливостей їх визначень у некомерційних сферах викликає неточне розуміння Business Intelligence та помилково обмежує застосування лише сферами бізнесу у традиційному розумінні цього терміну на українській мові.

Зміст базових термінів для сфери автоматизації інформаційної роботи визначив у 1958 р. у статті журналу IBM науковий співробітник компанії Hans Peter Luhn. Термін «business» – діяльність для досягнення цілей у сферах науки, технології, торгівлі, промисловості, правочинства, уряду, оборони та ін. [11].  З посиланням на тодішню редакцію словника Вебстера (Webster’s New Collegiate Dictionary), «intelligence» – здатність розуміти взаємні зв’язки представлених фактів таким чином, щоб діяти у напрямку до бажаної мети. Підкреслено, що запропонована “A Business Intelligence system” може використовуватися у будь-якій із вказаних сфер діяльності. Неврахування цих маловідомих визначень та метафоричного характеру терміну Business Intelligence  привело до таких перекладів як: «бізнес-аналіз», «бізнес-інтелект», «ділова аналітика», «бізнес-аналітика». Неточність такого перекладу стала очевидною після додатково введеного компанією IDC терміну Business Analytics  software (програмне забезпечення  ділової аналітики). Термін Data Mining  неточно або розширено перекладають як «інтелектуальний аналіз”, «глибинний» аналіз даних», «розкопка даних», ін.; термін OLAP –  спрощено перекладають як «багатовимірний аналіз даних», «оперативний аналіз», ін.

Інша важлива група подібних складнощів для вивчення і реалізації Business Intelligence відображає конкуренцію у глобальному англомовному просторі. Для прикладу, навіть провідні консалтингові компанії дотримуються різних підходів до співвідношення загального і часткового при тлумаченні Business Intelligence, Performance Management (управління ефективністю, результативністю, продуктивністю), Business  Analytics (ділова аналітика) та інших базових термінів [3-6].

Велика кількість різних перекладів і тлумачень базових термінів значно ускладнює розуміння термінів широкими колами можливих користувачів. Уточнити співвідношення між базовими термінами доцільно на основі аналізу їх складових у різних проблемних областях діяльності.

Так, у статті [12], присвяченій з’ясуванню змісту терміну Intelligence у розвідці, можна виділити більше 20-ти його визначень. Зміст цього терміну також ґрунтовно розглядається у багатьох публікаціях присвячених Artificial Intelligence (термін-метафора, який прийнято перекладати як «штучний інтелект»), насамперед, у його зв’язку з терміном «знання» [13]. У обох тематичних групах публікацій аналіз змісту терміну проводиться, як правило, без врахування його тлумачення у іншій галузі, навіть у разі посилання на тлумачні словники Вебстера, для прикладу, у [11] і [12]. Їх аналіз показує, що порівняно з Performance Management  і Business  Analytics, термін Intelligence (Business Intelligence) можливо вважати більш загальним. Адже Intelligence вживається у багатьох країнах для позначення розвідувальних служб і їх діяльності та відноситься не тільки до збору й аналізу інформації, але й до інших видів діяльності. У штучному інтелекті термін Intelligence теж має ширше значення ніж Analytics. Крім цього, наступним етапом розвитку автоматизованих інформаційно-управляючих систем доцільно вважати мережеві ергатичні (людино-машинні) організми (Network Ergatic Organism – NEO), засновані на Artificial Intelligence й Business Intelligence у розширеному тлумаченні, включаючи інтелектуальні програмні агенти, ін. Мережеві ергатичні організми, їх елементи та мережі  по суті вже створені і застосовують в Інтернеті та за його межами. Організмічний (від слова «організм») підхід до створення автоматизованих інформаційно-аналітичних і управляючих систем у найбільшій мірі узгоджений із сутністю організмів, які існують у природі у різних часткових та найбільш загальній формі.

2. Після розпаду єдиного радянського науково-термінологічного простору та у зв’язку із глобалізацію наукової й інформаційної діяльності, військового співробітництва, розповсюдження уніфікованих засобів автоматизації, необхідно здійснювати перехід до міжнародної науково-прикладної термінології. Усунення неоднозначностей у тлумаченні термінів, які впливають на реалізацію Business Intelligence, Geospatial Business Intelligence та інших зв’язаних термінів доцільно здійснити шляхом їх визначення у концепціях дослідного застосування Business Intelligence у різних сферах ділової діяльності. При цьому доцільно широко використовувати англомовне (міжнародне) позначення термінів, що практикується навіть у публікаціях на ієрогліфічних мовах. Проте, уточнення термінів  можна здійснити лише після вибору програмних платформ для Geospatial Business Intelligence, адже різні розробники мають деякі відмінності  у термінології.

3. Неможливо реалізувати ефективну систему Geospatial Business Intelligence шляхом неузгоджених «крапкової», «клаптикової» або «процесної» автоматизації у рамках різних підсистем. Це особливо актуально в умовах обмежених фінансових та кадрових ресурсів.

Можливим шляхом вирішення цього проблемного питання може бути розробка всіх компонентів «зверху до низу» або “від середини вверх і вниз” на основі модульної уніфікованості зі статичними (загальними для всіх) частинами і темпоральними (змінними). Такий підхід передбачає наступне.

1) Створення розширюваних модульно-уніфікованих моделей метаданих. Статична частина моделей може містити  однакові для всіх горизонтальних і вертикальних підсистем елементи в однаковому форматі: просторові координати, позначення країн, зареєстровані елементи для часткових евристичних потреб, ін. Темпоральна частина може містити  додаткові змінні елементи, які специфічні для часткових проблемних областей роботи. Подібний підхід реалізовано, для прикладу, в моделі метаданих Провідника Windows (налічує більше 50-ти елементів), яка є спільною для всіх ПЕОМ з цією операційною системою і використовується у всьому світі, хоча значна частина елементів Провідника не використовується та має інші недоліки.

Найбільш доцільною основою моделі даних може бути модифікована Star Chema, інтегрована з гібридною трьохкомпонентною моделлю подання знань FPS (Frame, Production system, Semantic networks) – фреймово-продукційною, з мультимедійними семантичними мережами [9]. У відкритих публікаціях можливість і умови побудови сховищ даних на основі схеми даних «зірка» визначив у 2007 р. «батько» концепції сховищ даних Bill Inmon. Такий підхід зменшує до мінімуму кількість операцій вилучення, перетворення і завантаження (Extraction, Transformation, Loading, ETL) даних між підсистемами. Адже розробка ETL процедур потребує значну кількість ресурсів та у багатьох випадках перевищує їх ліміт. Неврахування цього положення може звести нанівець всі зусилля щодо створення системи Geospatial Business Intelligence, залишаючи її на рівні несумісних між собою малоефективних  «клаптикових» або «процесних» підсистем.

2) Вказане для моделей метаданих та даних у повній мірі стосується і програмних комплексів. Необхідно зазначити, що створені силами окремих фахівців  та маловідомих фірм засоби  Business Intelligence та ГІС (GIS) не можуть конкурувати зі створеними такими компаніями як Microsoft, SAP, Oracle та іншими, які займають  найвищі місця у світових рейтингах, для прикладу, у діаграмах Magic Quadrants Gartner. Адже всі комплекси розроблених ними засобів мають модульно-уніфіковану структуру, у багатьох випадках сумісні між собою і передбачають можливості адаптації та удосконалення фахівцями різних рівнів підготовки. Керівники IT?підрозділів під час конференції IDC Business Intelligence Roadshow 2010 у м. Києві зазначали, що навіть у потужних фінансових корпораціях виникають суттєві проблеми зі значною кількістю так  званих «самописними» програм, особливо після звільнення з роботи їх розробників. Необхідно зазначити, що засоби Business Intelligence не мають закритої архітектури. Вони мають модульну архітектуру із закритим ядром, яке забезпечує стійкість виконання основних функцій і сумісність окремих екземплярів та різних версій, а також кілька повністю чи частково відкритих рівнів, які дозволяють підготовленим користувачам модифікувати їх для своїх потреб, у тому числі непрограмуючими фахівцям за допомогою мов рівня 4GL.

3) Всі консалтингові компанії у оцінках платформ Business Intelligence оцінюють їх сумісність з Microsoft Office та відзначають особливу роль Microsoft Office Excel як універсального кіоску даних. Його остання версія спроможна опрацьовувати більше ніж 100 мільйонів записів, має деякі функції системи управління базами даних, а починаючи з 2007 року може інтегрувати надбудови інтелектуального аналізу, які дозволяють вирішувати задачі Data Mining. Отже, будь-яка система Geospatial Business Intelligence повинна забезпечувати перенесення даних до Microsoft Office Excel з мінімальною кількістю операцій ETL. З цієї електронної таблиці дані можна перенести до будь-якого іншого аналітичного комплексу та ефективно накопичувати і обробляти у разі однакових моделей метаданих різних інформаційних масивів.

4) Підсумовуючи вказане у даному пункті, зазначимо, що розширювана модульна уніфікованість з використанням статичних і темпоральних частин гібридних моделей даних і знань та програмного забезпечення забезпечує реалізацію мереже-центричної острівної побудови системи Geospatial Business Intelligence. У ній будь-яка кількість окремих модульно-уніфікованих «островів» (підсистем) може функціонувати в автономному режимі або з’єднуватися з головним центром чи між собою у будь-якій комбінації. Це забезпечує умови для спільного аналізу первинних даних і підтримки прийняття рішень на системному рівні. Адже головною проблемою є не надмірна кількість первинної інформації, а її неузгоджена структура. Сучасні засоби OLAP, Data Mining, Visual Mining дозволяють обробляти терабайтні масиви даних і знаходити в них приховані закономірності, візуалізувати в агрегатованій чи деталізованій формі за комплексами різних зрізів. Тому для засобів Geospatial Business Intelligence, велика кількість однаково структурованих з різних джерел первинних даних є не недоліком, а необхідною умовою для побудови обґрунтованих моделей і виявлення аномальних виключень, формування достовірних висновків, прогнозів, ефективних деталізованих рішень.

4. Функціональні можливості Geospatial Business Intelligence тісно зв’язані з парадигмою побудови KMS – Knowledge Managment System (систем управління знаннями), яка визначає необхідність зв’язування у режимі On-line тих, «кому необхідні знання» з тими, «хто знає».

Найбільша у світі система управління знаннями вперше у світі створена у ЗС США. Її самою великою складовою є Army Knowledge On-line (AKO) [14]. Розроблені та затверджені нові 12 принципів управління знаннями, які роблять наголос на інформації і знаннях на відміну від наголосу на ІТ-системах у версії 2001 р. Структура необхідних метазнань метафорично позначена як know-why, know-what, know-who, know-how [14]. Зазначимо, що структуру знань доцільно більш повно визначити з використанням метафори Р. Кіплінга як: know-who  (знати про кого), know-what  (знати що або з чим сталося), know-when (знати коли сталося), know-where (знати де сталося), know-why (знати чому сталося), know-how (знати як сталося) [15]. До неї також доцільно додати know foresight (знати передбачення) або know forecast (знати прогноз) та інші темпоральні елементи знань, які специфічні для конкретної проблемної області роботи.. Додане відповідає одній із основних функцій засобів Business Intelligence  – Forecast (прогноз).

Деякі знання можуть бути виражені в Geospatial Business Intelligence у явній формі (Explicit Knowledge). Проте, значну  частину знань, насамперед, Tacit Knowledge («мовчазних» знань висококваліфікованих фахівців) неможливо формалізувати у зв’язку зі складністю цього процесу і у зв’язку з неможливістю охоплення всіх елементів часткових проблемних областей роботи. Тому у системі управління знаннями (KMS) необхідно зберігати також метазнання про носіїв знань, насамперед, про носіїв Tacit Knowledge, у тому числі мати засоби зв’язку з ними, щоб використовувати всі види наявних знань для вирішення нових задач.

Виходячи з вказаного, можна запропонувати розширений перелік видів знань для Knowledge Managment,  Business Intelligence, Geospatial Business Intelligence та інформаційних документів, позначивши його у  спрощеній метафоричній формі як KNOW: WHO; WHAT; WHEN; WHERE; WHY; HOW; FORECAST, X (W5HFX). Множина X елементів повинна бути уточнена для часткових проблемних областей роботи. Як видно, не менше ніж одна складова знань (know-where) відноситься безпосередньо до геопросторової інформації.

Висновки. У рамках однієї публікації можливо розглянути тільки частину проблемних питань, що постають при розробці Geospatial Business Intelligence. Розробка такої системи  є складною мультидисциплінарною задачею. Результатом її вирішення повинно бути  об’єднання GIS (ГІС), Business Intelligence, Knowledge Management System на єдиних модульно-уніфікованих моделях зі статичними (загальними для всіх) і темпоральними (змінними, спеціалізованими для окремих проблемних областей роботи) частинами. Це стосується набору концепцій, технологій розробки і використання системи  обробки інформації, комплексних моделей даних і знань, комплексів програмних засобів. Проте, найскладнішою задачею є об’єднання для розробки фахівців різної наукової і прикладної спеціалізації в умовах обмежень на фінансові і кадрові ресурси, ін. Таке об’єднання можливе на основі запропонованої ієрархічно-синергетичної інтеграції, яка передбачає не тільки  ієрархічне управління але й елементи самоорганізації.

Перспективою подальших  публікацій є подання варіанту удосконаленої архітектури Geospatial Business Intelligence з використанням DSS BI 2.0.

Джерела:

  1. Assessing The Maturity Level of Geospatial Business Intelligence. 2011/01/06. By Ritesh Gupta //http://slashgeo.org/
  2. Spot On, Geospatial Business Intelligence (Integration IBM Cognos 8 BI and ESRI ArcGIS) // http://www.spotonsystems.com/.
  3. Gartner, Gartner Business Intelligence Summit 2010  //http://www.gartner.com/
  4. Forrester, The State Of Business Intelligence Software And Emerging Trends: 2010 by Holger Kisker, Ph.D  // http://www.forrester.com/.
  5. IDC, Dan Vesset. Worldwide Business Intelligence Tools 2009 Vendor Shares. June 2010 //http://www.idc.com.
  6. Bi Verdict, Mark Rittman. News on The BI Verdict, and an Interview with Nigel Pendse. 19.01.2010 //http://www.bi-verdict.com.
  7. NGA, National Geospatial-Intelligence Agency  – official website //http:// nga.mil.
  8. ESCC, Business Intelligence Reference Guide  (Army Business Intelligence) //http:// escc.army.mil.
  9. Круковський І.А. Узагальнена архітектура системи підтримки прийняття рішень на основі Business Intelligence у розширеному тлумаченні / І.А. Круковський // Вісник ЖДТУ. – 2010. – Вип. 2 (53). – С. 103-111.  http://archive.nbuv.gov.ua/portal/natural/VZhdtu/2010_2_1/14.pdf
  10. Круковський І.А. Удосконалені вимоги до реалізації OLAP у DSS для часткових проблемних областей інформаційно-аналітичної роботи: військ.-техн. зб. / І.А. Круковський // Академія сухопутних військ. – 2010. – Вип. 3. – С. 26–32. http://archive.nbuv.gov.ua/portal/natural/Vtz/2010_3/26-33.pdf
  11. IBM, Luhn  H.P. A Business Intelligence System  (PDF) / Н.Р. Luhn  // IBM Journal. (November 1958) //http://www.research.ibm.com.
  12. CIA, Michael Warner. Wanted: A Definition of “Intelligence” — Central Intelligence Agency //https://www.cia.gov/library/center-for-the-study-of-intelligence/.
  13. Левитин К.Е. Будущее искусственного интеллекта : сб. / АН СССР; ред.-сост. : К.Е. Левитин, Д.А. Поспелов. – М. : Наука, 1991. – 302 с.
  14. AKO, Army Knowledge Management Principles //https://www.us.army.mil.
  15. Wikipedia, Six Honest Serving Men (Five Ws.) From Wikipedia, the free encyclopedia http://en.wikipedia.org/.

Дана стаття вперше опублікована у збірнику: Геоінформаційні системи у військових задачах. “Січневі ГІСи” Другий науково-технічний семінар 21 22 січня 2011 року. – Львів: Академія Сухопутних військ, 2011. – С. 117-125. [Електронний ресурс]. – Режим доступу :  http://www.asv.gov.ua/content/nauka/gis.pdf .

Залишити відповідь