Архіви категорій: Big Data

Містить нотатки за категорією Big Data

Про атаки на “Нотатки про BI+”

Зі зрозумілих причин, певний час тому назад у “Нотатках про Business Intelligence +” встановлені засоби реєстрації та аналізу можливих зловмисних дій, проте на сайті не використовуються потужні платні системи захисту чи моніторингу. Тому в адміністрації сайту викликають увагу лише найбільш настирливі, явно зловмисні й одночасно наївні web-користувачі.

Про настирність, зловмисність і наївність

Дуже відвідуваною є сторінка для введення пароля доступу до адміністративної частини сайту. Для прикладу, за останні 40 діб її відвідували більше ніж 600 раз, при цьому адміністратор заходив лише пару разів.

Один зі сторонніх сайтів (pro…) записаний до бази даних за останні 30 днів 718 разів (?!) – це не програмні агенти інформаційно-пошукової системи.

В один з днів цього місяця було здійснено 72 спроби підібрати пароль до сайту з одного і того ж комп’ютера чи роутера. З урахуванням того, що  доступ до введення паролю блокувався після певної кількості неправильних спроб, то фактично якийсь web-користувач настійливо вводив пароль до сайту майже цілу добу безперервно, а саме 22 години 25 хвилин (?!). Скоріше за все, це можливо у разі цілодобового чергування спеціалізованої групи web-користувачів. Ймовірно, хтось ризикує розкрити свої ІТ-центри інформаційно-психологічних операцій (диверсій) у web-просторі. А можливо, хтось кличе адміністратора сайту вийти на зв’язок з власником IP-адреси (IP: 85.31.101.229) та ureyveellk@gmail.com, Georgelig? На сайті тривалий час була випадково помилкова адреса для зв’язку,  яка замінена на правильну: I@dss-bi.com.ua.

Показане фото – з сайту школи у м. Іваново Російської Федерації:  “Муніципальний бюджетний освітній заклад середня загальноосвітня школа № 18”. На сайті цієї школи, для прикладу, зареєстрований  Georgelig, ureyveellk@gmail.com.

З 2006 року діє “Государственная программа пересления соотечественников в Российскую Федерацию”. У 2012 році Путін затвердив  її нову редакцію. За оцінкою всіх російських державних спеціалістів, програма переселення співвітчизників у РФ у 2006-2013 роках провалена. Так, росіяни фактично втікають з місць пріоритетного заселення (за Уралом). Також етнічні росіяни унаслідок недолугої політики федералізації втікають з регіонів, які межують з Чечнею, Інгушетією, Дагестаном. Ймовірно, тому Путіну прийшла в голову ідея вирішити цю проблему шляхом фашистської агресії проти України та анексії у стилі Гітлера нашої землі. “З наскоку” це не вдалося у повній мірі, тому Путін і його помічники організували, фінансують, озброюють і безпосередньо керують через свої спецслужби “сепаратистськими” рухами на сході України. Як мінімум вони намагаються зруйнувати економіку регіону, посіяти ненависть між громадянами України, озброїти злочинців, нав’язати через своїх озброєних агентів мирному населенню регіонів свої “республіки”. Подібні рухи вже давно існують в РФ. Це характерно для Далекого Сходу і Сибіру та Північного Кавказу. Для прикладу, Чечня, Інгушетія, Дагестан за останні десятиліття фактично стали моноетнічними республіками-державами, що фінансуються з державного бюджету і за допомогою методу “повзучої анексії” захоплюють землі донських і кубанських козаків та відбирають у них свої явно етнічні землі. Ці “заслані козачки” намагаються втягнути в своє багно і населення східних регіонів України.

Путінська Росія у себе в країні та у сусідніх країнах, в усіх сферах діяльності перетворилася у країну-спонсора тероризму, його організатора і виконавця. Лише за два місяці Путін і його помічники перетворили туристичний Крим у центр міжнародного тероризму та у зону, якою керують відомі кримінальні угруповання. Очевидно, що негативний терористичний і кримінальний вплив з анексованого і окупованого РФ Криму буде розповсюджуватися на Ближній Схід й Середній Схід, буде грубо суперечити інтересам всіх країн. Росії це не дасть нічого позитивного, крім задоволення від уявної можливості впливу на світові події. РФ має 146 млн. населення, ВВП у 2,2 рази менше Японії, яка у 46 разів менше за територією. В усьому Сибіру і на Далекому Сході живе менше 10 млн. росіян, а лише у одній сусідній провінції Китаю – більше 150 млн. китайців. Навіщо Російській Федерації Далекий Схід? Щоб у Кремлі завжди була свіжа ікра та щоб пітерці Путін з Медвєдєвим пишатися великою державою? А як живуть прості люди на Далекому Сході РФ?

Трагедія федералізації на прикладі Ставропольського краю, для прикладу, показана у відео російського журналіста Кисельова. Цей горе-журналіст використовує відео та фото убивств на Кавказі для фальсифікації дій української влади.

Трагедія виходу російського населення від Уралу до Європейської частини РФ та наростаючі проблеми примітивізації промислового виробництва в РФ розглянуті у передачі “Точка зрения” (Как остановить распад России) провідних російских фахівців у сфері демографічної політики.

Розповсюдження у світі соцмереж Facebook, Twitter, Google plus, ВКонтакте, Однокласники

БЕЗ КОМЕНТАРІВ

Ілюстрація розповсюдження у світі з 2004 року по теперішній час соціальних мереж Facebook, Twitter, Google plus, ВКонтакте, Однокласники – на основі підрахунку відповідних пошукових запитів (статистика Google):

Ілюстрація розповсюдження соціальної мережі Facebook у світі – на основі підрахунку відповідних пошукових запитів (статистика Google):

Ілюстрація розповсюдження соціальної мережі Twitter у світі – на основі підрахунку відповідних пошукових запитів (статистика Google):


Ілюстрація розповсюдження соціальної мережі Google+ у світі – на основі підрахунку відповідних пошукових запитів (статистика Google):

 

Ілюстрація розповсюдження соціальної мережі ВКонтакте у світі – на основі підрахунку відповідних пошукових запитів (статистика Google):

 

Ілюстрація розповсюдження соціальної мережі Однокласники у світі – на основі підрахунку відповідних пошукових запитів (статистика Google):

Карти розповсюдження в Україні Business Intelligence, Data Mining, OLAP

Опубліковані інтерактивні карти ілюструють розповсюдження в Україні інформаційно-аналітичних технологій Business Intelligence, Data Mining та OLAP (Online Analytical Processing) – на основі статистики використання у пошуковій системі Google відповідних пошукових слів.
Ці ілюстрації не характеризують використання Business Intelligence, Data Mining та OLAP у найбільш потужних українських та міжнародних підприємствах, де вони реалізовані на високому чи найвищому світових рівнях. Графіки ілюструють недоліки у використанні відповідних технологій у великій кількості середніх і невеликих підприємств, а також у сфері вищої освіти (навчання).
Сподіваюся, що це сприятиме більш активному розповсюдженню відповідних технологій в Україні.

Проблемні питання розробки і реалізації Geospatial Business Intelligence

Концепція, технологія і засоби  Geospatial Business Intelligence засновані на комплексуванні hi-tech функцій Business Intelligence та Geographic Information System (GIS) – геопросторових інформаційних систем (ГІС) [1, 2]. У теперішній час процес цього комплексування знаходиться на етапі становлення, концентруючись на нетривіальній обробці й візуалізації інформації, яка міститься в GIS.  Існують також конкуруючі терміни. Провідні у світі консалтингові компанії Gartner, Forrester, IDС та незалежні аналітики [3-6] розглядають Business Intelligence як життєво важливу технологію забезпечення більш осмислених, гнучких й ефективних рішень і на протязі останніх п’яти років ставлять у першу п’ятірку 10-ти найактуальніших інформаційних технологій [3].

Geospatial Business Intelligence реалізується у різних комерційних і некомерційних сферах діяльності. Так, на сторінках National Geospatial-Intelligence Agency (Національного Агенства Геопросторової Розвідки) США в Інтернеті встановлені гіперпосилання на сторінки з Geospatial Business Intelligence [7]. У 2010 р. керівником агенства вперше в історії співтовариства розвідувальних органів США призначена жінка (цивільний фахівець), що, ймовірно, свідчить про перехід до активнішого використання технологій подвійного призначення, у тому числі у сфері попередження населення про стихійні лиха, тощо.

У Збройних силах США у 2005 р. створено U.S. Army Enterprise Solutions Competency Center (Центр компетенції  корпоративних рішень). Центр випустив довідкове керівництво з Army Business Intelligence та інші [7]. У документі показано, що у 21-му столітті у сфері обробки інформації наступив третій етап – Business Intelligence Age (ера Business Intelligence). Зазначимо, що термін Business Intelligence у його теперішньому тлумаченні запропонував у 1989 р. Hovard Dresner, який з цього часу почала підтримувати компанія  Gartner; у цьому ж році Григорій Пятецький-Шапіро (Gregory Piatetsky-Shapiro) провів перший семінар з Knowledge Discovery in Databases (відкриття знань у базах даних), складовою частиною чого є Data Mining, які є важливою складовою Business Intelligence.

Отже, актуальним завданням є аналіз шляхів використання Geospatial Business Intelligence (має подвійне призначення).

Business Intelligence  –  термін-метафора, який не має дослівного перекладу й однозначного тлумачення і використовується як узагальнене позначення ієрархічно-синергетичного комплексу концепцій, технологій і засобів глибинної обробки первинної інформації для підтримки прийняття рішень. Основними складовими у найпростішому випадку є сховище даних (Data Warehouse) з кіосками й вітринами даних (Data Marts), засоби формування регламентованих запитів і звітів, OLAP, Data Ming, засоби статистичного аналізу та спеціальні засоби візуалізації добутих знань із даних. Сформована нова генерація Business Intelligence, яку часто відзначають  індексом «2.0». У [9] розглянуті особливості цього процесу та запропонована удосконалена узагальнена архітектура системи підтримки прийняття рішень (Desicion Support System  Business Intelligence 2.0, DSS BI 2.0). Засоби OLAP у DSS BI 2.0 запропоновано реалізувати на основі розширеного тесту FASMI+ (OLAP+), до якого інтегровані вимоги до знань [10]. Це визначає необхідність реалізації в OLAP базових функцій експертних систем.

Далі розглянуті деякі проблемні науково-прикладні питання, що потребують розв’язання при створенні програмних комплексів Geospatial Business Intelligence та запропоновані шляхи їх вирішення.

1. Багато складнощів створюють неточні переклади і тлумачення базових термінів у даній сфері, для прикладу, Business та Intelligence. Неврахування особливостей їх визначень у некомерційних сферах викликає неточне розуміння Business Intelligence та помилково обмежує застосування лише сферами бізнесу у традиційному розумінні цього терміну на українській мові.

Зміст базових термінів для сфери автоматизації інформаційної роботи визначив у 1958 р. у статті журналу IBM науковий співробітник компанії Hans Peter Luhn. Термін «business» – діяльність для досягнення цілей у сферах науки, технології, торгівлі, промисловості, правочинства, уряду, оборони та ін. [11].  З посиланням на тодішню редакцію словника Вебстера (Webster’s New Collegiate Dictionary), «intelligence» – здатність розуміти взаємні зв’язки представлених фактів таким чином, щоб діяти у напрямку до бажаної мети. Підкреслено, що запропонована “A Business Intelligence system” може використовуватися у будь-якій із вказаних сфер діяльності. Неврахування цих маловідомих визначень та метафоричного характеру терміну Business Intelligence  привело до таких перекладів як: «бізнес-аналіз», «бізнес-інтелект», «ділова аналітика», «бізнес-аналітика». Неточність такого перекладу стала очевидною після додатково введеного компанією IDC терміну Business Analytics  software (програмне забезпечення  ділової аналітики). Термін Data Mining  неточно або розширено перекладають як «інтелектуальний аналіз”, «глибинний» аналіз даних», «розкопка даних», ін.; термін OLAP –  спрощено перекладають як «багатовимірний аналіз даних», «оперативний аналіз», ін.

Інша важлива група подібних складнощів для вивчення і реалізації Business Intelligence відображає конкуренцію у глобальному англомовному просторі. Для прикладу, навіть провідні консалтингові компанії дотримуються різних підходів до співвідношення загального і часткового при тлумаченні Business Intelligence, Performance Management (управління ефективністю, результативністю, продуктивністю), Business  Analytics (ділова аналітика) та інших базових термінів [3-6].

Велика кількість різних перекладів і тлумачень базових термінів значно ускладнює розуміння термінів широкими колами можливих користувачів. Уточнити співвідношення між базовими термінами доцільно на основі аналізу їх складових у різних проблемних областях діяльності.

Так, у статті [12], присвяченій з’ясуванню змісту терміну Intelligence у розвідці, можна виділити більше 20-ти його визначень. Зміст цього терміну також ґрунтовно розглядається у багатьох публікаціях присвячених Artificial Intelligence (термін-метафора, який прийнято перекладати як «штучний інтелект»), насамперед, у його зв’язку з терміном «знання» [13]. У обох тематичних групах публікацій аналіз змісту терміну проводиться, як правило, без врахування його тлумачення у іншій галузі, навіть у разі посилання на тлумачні словники Вебстера, для прикладу, у [11] і [12]. Їх аналіз показує, що порівняно з Performance Management  і Business  Analytics, термін Intelligence (Business Intelligence) можливо вважати більш загальним. Адже Intelligence вживається у багатьох країнах для позначення розвідувальних служб і їх діяльності та відноситься не тільки до збору й аналізу інформації, але й до інших видів діяльності. У штучному інтелекті термін Intelligence теж має ширше значення ніж Analytics. Крім цього, наступним етапом розвитку автоматизованих інформаційно-управляючих систем доцільно вважати мережеві ергатичні (людино-машинні) організми (Network Ergatic Organism – NEO), засновані на Artificial Intelligence й Business Intelligence у розширеному тлумаченні, включаючи інтелектуальні програмні агенти, ін. Мережеві ергатичні організми, їх елементи та мережі  по суті вже створені і застосовують в Інтернеті та за його межами. Організмічний (від слова «організм») підхід до створення автоматизованих інформаційно-аналітичних і управляючих систем у найбільшій мірі узгоджений із сутністю організмів, які існують у природі у різних часткових та найбільш загальній формі.

2. Після розпаду єдиного радянського науково-термінологічного простору та у зв’язку із глобалізацію наукової й інформаційної діяльності, військового співробітництва, розповсюдження уніфікованих засобів автоматизації, необхідно здійснювати перехід до міжнародної науково-прикладної термінології. Усунення неоднозначностей у тлумаченні термінів, які впливають на реалізацію Business Intelligence, Geospatial Business Intelligence та інших зв’язаних термінів доцільно здійснити шляхом їх визначення у концепціях дослідного застосування Business Intelligence у різних сферах ділової діяльності. При цьому доцільно широко використовувати англомовне (міжнародне) позначення термінів, що практикується навіть у публікаціях на ієрогліфічних мовах. Проте, уточнення термінів  можна здійснити лише після вибору програмних платформ для Geospatial Business Intelligence, адже різні розробники мають деякі відмінності  у термінології.

3. Неможливо реалізувати ефективну систему Geospatial Business Intelligence шляхом неузгоджених «крапкової», «клаптикової» або «процесної» автоматизації у рамках різних підсистем. Це особливо актуально в умовах обмежених фінансових та кадрових ресурсів.

Можливим шляхом вирішення цього проблемного питання може бути розробка всіх компонентів «зверху до низу» або “від середини вверх і вниз” на основі модульної уніфікованості зі статичними (загальними для всіх) частинами і темпоральними (змінними). Такий підхід передбачає наступне.

1) Створення розширюваних модульно-уніфікованих моделей метаданих. Статична частина моделей може містити  однакові для всіх горизонтальних і вертикальних підсистем елементи в однаковому форматі: просторові координати, позначення країн, зареєстровані елементи для часткових евристичних потреб, ін. Темпоральна частина може містити  додаткові змінні елементи, які специфічні для часткових проблемних областей роботи. Подібний підхід реалізовано, для прикладу, в моделі метаданих Провідника Windows (налічує більше 50-ти елементів), яка є спільною для всіх ПЕОМ з цією операційною системою і використовується у всьому світі, хоча значна частина елементів Провідника не використовується та має інші недоліки.

Найбільш доцільною основою моделі даних може бути модифікована Star Chema, інтегрована з гібридною трьохкомпонентною моделлю подання знань FPS (Frame, Production system, Semantic networks) – фреймово-продукційною, з мультимедійними семантичними мережами [9]. У відкритих публікаціях можливість і умови побудови сховищ даних на основі схеми даних «зірка» визначив у 2007 р. «батько» концепції сховищ даних Bill Inmon. Такий підхід зменшує до мінімуму кількість операцій вилучення, перетворення і завантаження (Extraction, Transformation, Loading, ETL) даних між підсистемами. Адже розробка ETL процедур потребує значну кількість ресурсів та у багатьох випадках перевищує їх ліміт. Неврахування цього положення може звести нанівець всі зусилля щодо створення системи Geospatial Business Intelligence, залишаючи її на рівні несумісних між собою малоефективних  «клаптикових» або «процесних» підсистем.

2) Вказане для моделей метаданих та даних у повній мірі стосується і програмних комплексів. Необхідно зазначити, що створені силами окремих фахівців  та маловідомих фірм засоби  Business Intelligence та ГІС (GIS) не можуть конкурувати зі створеними такими компаніями як Microsoft, SAP, Oracle та іншими, які займають  найвищі місця у світових рейтингах, для прикладу, у діаграмах Magic Quadrants Gartner. Адже всі комплекси розроблених ними засобів мають модульно-уніфіковану структуру, у багатьох випадках сумісні між собою і передбачають можливості адаптації та удосконалення фахівцями різних рівнів підготовки. Керівники IT?підрозділів під час конференції IDC Business Intelligence Roadshow 2010 у м. Києві зазначали, що навіть у потужних фінансових корпораціях виникають суттєві проблеми зі значною кількістю так  званих «самописними» програм, особливо після звільнення з роботи їх розробників. Необхідно зазначити, що засоби Business Intelligence не мають закритої архітектури. Вони мають модульну архітектуру із закритим ядром, яке забезпечує стійкість виконання основних функцій і сумісність окремих екземплярів та різних версій, а також кілька повністю чи частково відкритих рівнів, які дозволяють підготовленим користувачам модифікувати їх для своїх потреб, у тому числі непрограмуючими фахівцям за допомогою мов рівня 4GL.

3) Всі консалтингові компанії у оцінках платформ Business Intelligence оцінюють їх сумісність з Microsoft Office та відзначають особливу роль Microsoft Office Excel як універсального кіоску даних. Його остання версія спроможна опрацьовувати більше ніж 100 мільйонів записів, має деякі функції системи управління базами даних, а починаючи з 2007 року може інтегрувати надбудови інтелектуального аналізу, які дозволяють вирішувати задачі Data Mining. Отже, будь-яка система Geospatial Business Intelligence повинна забезпечувати перенесення даних до Microsoft Office Excel з мінімальною кількістю операцій ETL. З цієї електронної таблиці дані можна перенести до будь-якого іншого аналітичного комплексу та ефективно накопичувати і обробляти у разі однакових моделей метаданих різних інформаційних масивів.

4) Підсумовуючи вказане у даному пункті, зазначимо, що розширювана модульна уніфікованість з використанням статичних і темпоральних частин гібридних моделей даних і знань та програмного забезпечення забезпечує реалізацію мереже-центричної острівної побудови системи Geospatial Business Intelligence. У ній будь-яка кількість окремих модульно-уніфікованих «островів» (підсистем) може функціонувати в автономному режимі або з’єднуватися з головним центром чи між собою у будь-якій комбінації. Це забезпечує умови для спільного аналізу первинних даних і підтримки прийняття рішень на системному рівні. Адже головною проблемою є не надмірна кількість первинної інформації, а її неузгоджена структура. Сучасні засоби OLAP, Data Mining, Visual Mining дозволяють обробляти терабайтні масиви даних і знаходити в них приховані закономірності, візуалізувати в агрегатованій чи деталізованій формі за комплексами різних зрізів. Тому для засобів Geospatial Business Intelligence, велика кількість однаково структурованих з різних джерел первинних даних є не недоліком, а необхідною умовою для побудови обґрунтованих моделей і виявлення аномальних виключень, формування достовірних висновків, прогнозів, ефективних деталізованих рішень.

4. Функціональні можливості Geospatial Business Intelligence тісно зв’язані з парадигмою побудови KMS – Knowledge Managment System (систем управління знаннями), яка визначає необхідність зв’язування у режимі On-line тих, «кому необхідні знання» з тими, «хто знає».

Найбільша у світі система управління знаннями вперше у світі створена у ЗС США. Її самою великою складовою є Army Knowledge On-line (AKO) [14]. Розроблені та затверджені нові 12 принципів управління знаннями, які роблять наголос на інформації і знаннях на відміну від наголосу на ІТ-системах у версії 2001 р. Структура необхідних метазнань метафорично позначена як know-why, know-what, know-who, know-how [14]. Зазначимо, що структуру знань доцільно більш повно визначити з використанням метафори Р. Кіплінга як: know-who  (знати про кого), know-what  (знати що або з чим сталося), know-when (знати коли сталося), know-where (знати де сталося), know-why (знати чому сталося), know-how (знати як сталося) [15]. До неї також доцільно додати know foresight (знати передбачення) або know forecast (знати прогноз) та інші темпоральні елементи знань, які специфічні для конкретної проблемної області роботи.. Додане відповідає одній із основних функцій засобів Business Intelligence  – Forecast (прогноз).

Деякі знання можуть бути виражені в Geospatial Business Intelligence у явній формі (Explicit Knowledge). Проте, значну  частину знань, насамперед, Tacit Knowledge («мовчазних» знань висококваліфікованих фахівців) неможливо формалізувати у зв’язку зі складністю цього процесу і у зв’язку з неможливістю охоплення всіх елементів часткових проблемних областей роботи. Тому у системі управління знаннями (KMS) необхідно зберігати також метазнання про носіїв знань, насамперед, про носіїв Tacit Knowledge, у тому числі мати засоби зв’язку з ними, щоб використовувати всі види наявних знань для вирішення нових задач.

Виходячи з вказаного, можна запропонувати розширений перелік видів знань для Knowledge Managment,  Business Intelligence, Geospatial Business Intelligence та інформаційних документів, позначивши його у  спрощеній метафоричній формі як KNOW: WHO; WHAT; WHEN; WHERE; WHY; HOW; FORECAST, X (W5HFX). Множина X елементів повинна бути уточнена для часткових проблемних областей роботи. Як видно, не менше ніж одна складова знань (know-where) відноситься безпосередньо до геопросторової інформації.

Висновки. У рамках однієї публікації можливо розглянути тільки частину проблемних питань, що постають при розробці Geospatial Business Intelligence. Розробка такої системи  є складною мультидисциплінарною задачею. Результатом її вирішення повинно бути  об’єднання GIS (ГІС), Business Intelligence, Knowledge Management System на єдиних модульно-уніфікованих моделях зі статичними (загальними для всіх) і темпоральними (змінними, спеціалізованими для окремих проблемних областей роботи) частинами. Це стосується набору концепцій, технологій розробки і використання системи  обробки інформації, комплексних моделей даних і знань, комплексів програмних засобів. Проте, найскладнішою задачею є об’єднання для розробки фахівців різної наукової і прикладної спеціалізації в умовах обмежень на фінансові і кадрові ресурси, ін. Таке об’єднання можливе на основі запропонованої ієрархічно-синергетичної інтеграції, яка передбачає не тільки  ієрархічне управління але й елементи самоорганізації.

Перспективою подальших  публікацій є подання варіанту удосконаленої архітектури Geospatial Business Intelligence з використанням DSS BI 2.0.

Джерела:

  1. Assessing The Maturity Level of Geospatial Business Intelligence. 2011/01/06. By Ritesh Gupta //http://slashgeo.org/
  2. Spot On, Geospatial Business Intelligence (Integration IBM Cognos 8 BI and ESRI ArcGIS) // http://www.spotonsystems.com/.
  3. Gartner, Gartner Business Intelligence Summit 2010  //http://www.gartner.com/
  4. Forrester, The State Of Business Intelligence Software And Emerging Trends: 2010 by Holger Kisker, Ph.D  // http://www.forrester.com/.
  5. IDC, Dan Vesset. Worldwide Business Intelligence Tools 2009 Vendor Shares. June 2010 //http://www.idc.com.
  6. Bi Verdict, Mark Rittman. News on The BI Verdict, and an Interview with Nigel Pendse. 19.01.2010 //http://www.bi-verdict.com.
  7. NGA, National Geospatial-Intelligence Agency  – official website //http:// nga.mil.
  8. ESCC, Business Intelligence Reference Guide  (Army Business Intelligence) //http:// escc.army.mil.
  9. Круковський І.А. Узагальнена архітектура системи підтримки прийняття рішень на основі Business Intelligence у розширеному тлумаченні / І.А. Круковський // Вісник ЖДТУ. – 2010. – Вип. 2 (53). – С. 103-111.  http://archive.nbuv.gov.ua/portal/natural/VZhdtu/2010_2_1/14.pdf
  10. Круковський І.А. Удосконалені вимоги до реалізації OLAP у DSS для часткових проблемних областей інформаційно-аналітичної роботи: військ.-техн. зб. / І.А. Круковський // Академія сухопутних військ. – 2010. – Вип. 3. – С. 26–32. http://archive.nbuv.gov.ua/portal/natural/Vtz/2010_3/26-33.pdf
  11. IBM, Luhn  H.P. A Business Intelligence System  (PDF) / Н.Р. Luhn  // IBM Journal. (November 1958) //http://www.research.ibm.com.
  12. CIA, Michael Warner. Wanted: A Definition of “Intelligence” — Central Intelligence Agency //https://www.cia.gov/library/center-for-the-study-of-intelligence/.
  13. Левитин К.Е. Будущее искусственного интеллекта : сб. / АН СССР; ред.-сост. : К.Е. Левитин, Д.А. Поспелов. – М. : Наука, 1991. – 302 с.
  14. AKO, Army Knowledge Management Principles //https://www.us.army.mil.
  15. Wikipedia, Six Honest Serving Men (Five Ws.) From Wikipedia, the free encyclopedia http://en.wikipedia.org/.

Дана стаття вперше опублікована у збірнику: Геоінформаційні системи у військових задачах. “Січневі ГІСи” Другий науково-технічний семінар 21 22 січня 2011 року. – Львів: Академія Сухопутних військ, 2011. – С. 117-125. [Електронний ресурс]. – Режим доступу :  http://www.asv.gov.ua/content/nauka/gis.pdf .

Intelligence & Intelligence & Intelligence.

Версія 25.08.13-30.08.13

Дефініція “Intelligence” – автономна й одночасно системно утворююча у різних сферах ділової діяльності, у тому числі у сфері автоматизації інформаційної аналітичної діяльності й управління. Проте, у тлумаченні терміну “Intelligence” і пов’язаних з ним є неточності і навіть помилки. Це тривалий час негативно впливає на реалізацію і розвиток концепцій, технологій і засобів автоматизації інформаційної аналітичної діяльності й управління. Тому далі розглядаються особливості дефініції “Intelligence”, як ядра різних лінгвістичних, семантичних і прагматичних систем.

Системний підхід передбачає не тільки аналіз системи, яка є центром уваги, але й розгляд ієрархічно вищих систем, підпорядкованих систем,   інших взаємно діючих систем (дружніх, нейтральних, протидіючих і конкуруючих), ретроспективний аналіз і прогнозування розвитку системи у взаємно діючому середовищі, ін.

Одне з найбільш коротких і відповідних практиці застосування дефініції “Intelligence” подано у друкованому тлумачному словнику Longman Dictionary of Contentmporary English, де визначено, що “Intelligence” (узагальнено) – це 1a) здатність навчатися, розуміти, думати; 1b) високий рівень цієї здатності; 2а) розвідувальна інформація, 2b) розвідувальна організація. Перед “Intelligence” у словнику розміщені терміни “Intellect”, “Intellectual”, “Intellectualize”,  “Intellectual property”,  “Intelligence quotient” (IQ), а після – “Intelligent”, “Intelligentsia”, “Intelligible”.

Intelligence-1

Про особливості дефініції “Intelligence” як загального позначення розумової діяльності.

Wikipedia (Вікіпедія) містить ґрунтовну статтю про дефініцію “Intelligence” (“Свідомість”, «Сознание»). Показаний переклад підтверджує давно відомі проблеми з перекладом термінів «Artificial Intelligence» (“Штучний інтелект”) та «IQ» – «Intelligence quotient» (“Кофіцієнт інтелекту”).

У Вікіпедії на основній сторінці немає згадки про використання дефініції “Intelligence” у сфері розвідувальної діяльності.

Wiktionary (Вікісловник) має незакінчену сторінку, на якій вказані похідні терміни від “Intelligence”, послідовно: artificial intelligencemachine intelligenceCIAIQMI5MI6SIS.

Необхідно мати на увазі, що “Intelligence”, як можливість навчатися, розуміти, думати, властива не тільки людям, але й іншим організмам, які  можуть бути ефективними помічниками чи партнерами людей. Для прикладу,  ними є собаки, коні, дельфіни та інші тварини, які спроможні до певної корисної для людей фізичної і розумової діяльності. Корисними можуть бути навіть істоти з дуже простою логікою дій. Для прикладу, відомі “римські гуси“, які «спасли Рим» у часи древньої  міфологічної історії.

 В українській мові термін “розвідка” (не “Intelligence”)  може тлумачитися як дослідницька діяльність у широкому розумінні. Для прикладу, останнім пунктом вимог Вищої атестаційної комісії України до необхідних елементів наукових статей є такий: “… висновки з даного дослідження і перспективи подальших розвідок у даному напрямку.” Очевидно, що дане визначення використовує термін “розвідка” у найбільш загальному, науковому тлумаченні. Подібні застосування терміну Intelligence є і в англійській мові. Термін “Intelligence” в англомовних виданнях також вживають для позначення аналітичної інформації – продукту аналітико-синтетичної переробки первинної інформації експертами-аналітиками.

У семантичному відношенні дефініція “Intelligence” у сфері розумової діяльності нерозривно зв’язана з такими базовими поняттями як: “Information” (Інформація), “Data” (дані), “Knowledge” (“Знання”), “Wisdom” (“Мудрість”), “Organizm” (“Організм“). Доцільно визначати “Соціальну свідомість” (“Social Intelligence“), “Корпоративну свідомість” (“Corporate Intelligence”), “Групову свідомість” (“Group Intelligence”), тощо. Ці форми свідомості  «Intelligence» почали швидко розвиватися після широкого розповсюдження засобів зв’язку і перейшли на принципово новий рівень після створення глобальних комп’ютерних мереж та Social Media.

Інформація стала новим глобальним (мережевим) ресурсом для отримання нових знань і отримання на цій основі надприбутків провідними світовими корпораціями. Такими ресурсами раніше були лише матеріальні ресурси, а пізніше – енергетичні ресурси.

Системний підхід до розгляду дефініції “Intelligence”, як загального позначення розумової діяльності повинен враховувати також можливість існування високої сфери, яка слабо досліджена і слабо зрозуміла людьми за тривалий час. Ця сфера стосується існування Бога і відповідної Свідомості (Intelligence). Відомі  суперечливі факти, що Бог знає і може впливати на всіх узагальнено й індивідуально. Відомі суперечливі факти про деякі методики і можливості окремих людей бачити фрагменти минулого і майбутнього (КасандраНострадамусВольф МессінгВанга, ін.). Це свідчить, додатково до іншого, про можливість існування “Глобального Інформаційного Поля” (“Global Information Field”) і “Глобальної Свідомості” (“Global Intelligence”). У Біблії вказано, що тільки людина створена по образу і подібно до Бога. З цього можна зробити висновок, що люди можуть розуміти сутність створених Богом систем і створювати по аналогії подібні спрощені системи, у тому числі подібні до ймовірно існуючої системи “Global Intelligence”. У цьому процесі недопустима гординя людей по відношенню до Бога (“Глобальної Свідомості”), інакше люди будуть покарані. Очевидно, що Бог зацікавлений у розвитку і допомозі людям, яких він створив по образу і подібно до себе  – єдиних серед всіх живих організмів. Все вище вказане, на погляд автора, не суперечить вірі у Бога. Віра в інопланетян також не змінює сутності вказаного. Дослідження цих питань не виходить за межі науки, проте дана сфера дуже складна для пізнання і, ймовірно, у значній мірі закрита для людей на даному етапі нашого розвитку. Майже всі люди вірять у Бога і ходять у церкви (мечеті, синагоги, ін.), тому логічно допускати вище вказане.

Більшість своїх систем люди створили по аналогії з існуючими у природі. Багато дослідників вважають, що спроможність здійснювати умовиводи по аналогії є головною відмінністю людської свідомості (Intelligence) від свідомості інших живих організмів.

Розуміння перерахованих особливостей дозволяє використати їх по спрощеній аналогії для створення автоматизованих інформаційно-аналітичних систем. У кінці 20-го століття передові дослідження впритул підійшли до створення інформаційно-аналітичних систем, подібних до глобального інформаційного поля (Global Information Field) та Глобальної Свідомості (Global Intelligence).

Далі коротко розглянуті особливості дефініції “Intelligence” у сфері розвідувальної діяльності та у сфері автоматизації інформаційної аналітичної (розумової) діяльності.

Intelligence-2

Про особливості дефініції “Intelligence” та зв’язаних термінів у сфері розвідувальної діяльності.

Згідно тлумачних словників, другою важливою сферою застосування дефініції  “Intelligence” є сфера розвідувальної діяльності. Більше того, у суспільній свідомості термін “Intelligence” часто неправильно асоціюється лише з розвідувальними організаціями і їх діяльністю.

Ймовірно, найбільш глибокий аналіз особливостей дефініції “Intelligence” у сфері розвідувальної діяльності провів Dr. Michael Warner з підрозділу історії Central Intelligence Agency – CIA (Центральне розвідувальне управління – ЦРУ). У статті “Wanted: A Definition of “Intelligence”” (2008 р.), M. Warner проаналізував більше 20-ти тлумачень терміну «Intelligence» для вказаної сфери і зацікавлені читачі можуть знайти її у відкритому доступі в Інтернеті. У цілому, ця стаття є прикладом гарного шаблону для аналізу дефініцій у будь-якій сфері.

Проте, подані у статті цитати з тлумачних словників Webster’s Ninth New Collegiate й Oxford English Dictionary не відображають застосування дефініції “Intelligence” для позначення   розумової діяльності, а також застосування її у сфері автоматизації інформаційної аналітичної роботи.

Крім вказаного, відповідно до системного підходу доцільно зазначити, що термін “Intelligence” також зв’язаний з терміном-підсистемою “Reconnaissance”, який позначає розвідку тактичного рівня шляхом візуального спостереження, у тому числі аеророзвідку на низьких висотах, ін. У теперішній час можливо вважати, що Reconnaissance використовується на стратегічному рівні у режимі real-time, інтегровано із засобами вогневого ураження. Приклад – застосування на стратегічному і тактичному рівнях безпілотних літальних апаратів (drone) з функціями розвідки і вогневого ураження.

Також, термін “Intelligence” входить до різних семантичних кластерів, для прикладу: C5ISR (command, control, communications, computers, combat systems, intelligence, surveillance, and reconnaissance – командування, управління, зв’язок, комп’ютери, бойові системи, стратегічна розвідка, спостереження, розвідка місцевості). У цьому кластері термін “Intelligence” позначає збір, аналіз та поширення інформації. Проте, аналіз показує, що у сфері розвідувальної діяльності дефініція “Intelligence” із самого початку позначала значно ширшу сферу діяльності ніж інформаційна аналітична робота. Перспективою трансформації змісту «Intelligence» у цій сфері є більш тісна real-time інтеграція підсистем: “командування” – “управління” – “засоби вогневого ураження”.

Із діяльністю розвідувальних організацій  (“Intelligence”) все більш часто асоціюються спеціальні операції у сфері функціонування комп’ютеризованих мережевих систем, які можуть приводити до виведення зі строю об’єктів управління.

Також, з цією сферою все більше асоціюються інформаційно-психологічні операції у соціальній, політичній й економічній сферах, у тому числі у глобальній інформаційній мережі Інтернет. Очевидно, що ці операції носять комплексний характер і у багатьох випадках по суті є інформаційно-психологічними війнами, які часто ведуться в односторонньому порядку і можуть бути початковою фазою традиційної війни. Такі війни можуть мати катастрофічний характер для держав, їх організацій та громадян. У повній мірі це стосується України.

Слово “Intelligence” також входить до словосполучень, які визначають дефініції “Open Sourse Intelligence” (“OSINT“) – розвідка відкритих джерел та “Competitive Intelligence” (“Конкурентна розвідка“) – розвідка легальними методами у бізнесі. Для позначення розвідки у бізнесі нелегальними методами використовують терміни “industrial espionage”, “economic espionage”, “corporate espionage“.

Необхідно також зазначити, що використання дефініції “Intelligence” у сфері розвідувальних служб нерозривно пов’язано з демократичним контролем суспільства за їх діяльністю. Для прикладу, після бурхливої суспільної дискусії у 2001-2007 р.р. у США – всі федеральні агентства щорічно звітують перед Конгресом і Президентом про розвиток і використання hi-tech інформаційно-аналітичних засобів для збору й аналізу інформації всередині країни. Значна частина звітних документів відкрита громадянам. На авторський погляд, останнє здійснюється з трьох основних причин: 1) захистити права громадян щодо недопущення безпідставного аналізу інформації про них і прийняття на основі автоматичних алгоритмів; 2) не допустити нецільове використання коштів, що виділяються державою на розвиток інформаційно-аналітичних hi-tech спеціального призначення; 3) забезпечити розвиток вказаних hi-tech. В Україні назріла необхідність у прийнятті подібного Закону. Інакше  hi-tech інформаційно-аналітичні засоби можуть бути використані для придушення демократії, у тому числі у несанкціонованому режимі для досягнення особистих чи групових цілей. У кінцевому наслідку це може загальмувати економічний розвиток держави.

Intelligence-3

Про особливості дефініції “Intelligence” та зв’язаних термінів у сфері автоматизації інформаційної аналітичної діяльності й управління.

У 1950 р. англійський вчений Alan Turing (Аллан Тьюрінг) у філософському журналі «Mind» (“Розум”) опублікував статтю ”Computing Machinery and Intelligence” (“Комп’ютерні обчислення і свідомість”), де запропонував тест для перевірки спроможності комп’ютера мислити, точніше – відповідати на запитання так само як людина. Терміни «Intelligent Machinery», «computer intelligence» він вживав у публікаціях з 1941 р.

Важливими похідними термінами від “Intelligence” у сфері автоматизації інформаційної аналітичної роботи й управління є: “Artificial Intelligence” (AI), “Business Intelligence” (BI), ін.

Термін “Artificial Intelligence” запропонував у 1955 р. американський вчений John McCarthy (Джон Маккарті), а у 1956 році він ініціював першу міжнародну конференцію для зосередження досліджень з Artificial Intelligence.

У 1958 р. науковий співробітник компанії IBM Hans Peter Luhn (Ганс Петер Лун) у статті «A Business Intelligence System» в «IBM Journal» для введення дефініції “Intelligence” використав цитату з тлумачного словника Webster’s New Collegiate Dictionary, де вказано (узагальнено), що ”Intelligence – це здатність розуміти взаємні зв’язки представлених фактів таким чином, щоб діяти у напрямку до бажаної мети”. Проте, у статті не вказано, що термін “Intelligence” вживається також у сфері розвідувальних організацій. Також, H. P. Luhn від свого імені ввів термін ”Business” – діяльність для досягнення цілей у сферах науки, технології, торгівлі, промисловості, правочинства, уряду, оборони, ін. Введення у статті термінів “Intelligence” і “Business” здійснене для кращого розуміння читачами сфер застосування запропонованої архітектури «A Business Intelligence System”. Тепер ця архітектура асоціюється із системами управління електронними документами (Electronic Document Management, EDM), системами управління контентом підприємства (Enterprise Content Management, ECM) та ін. Компанія ІВМ, яка ввела термін, є одним із провідних розробників цих систем, для прикладу, IBM Lotus Notes/Domino. Такі системи іноді асоціюють з більш загальним класом систем управління знаннями (Knowledge Management System, KMS).

Термін «Business Intelligence» у його теперішньому тлумаченні запропонував у 1989 р. Hovard Dresner (Говард Дрезнер), який після цього 13 років працював у консалтинговій компанії Gartner науковим співробітником, віце-президентом і провідним аналітиком за напрямком Business Intelligence. Компанія Gartner активно поширювала термін “Business Intelligence” – як позначення комплексу «концепцій і методів покращання розробки ділових рішень з використанням систем підтримки, заснованих на фактах». До цих систем («fact-based support systems») можна віднести, насамперед, Decision Support System (системи підтримки прийняття рішень) на основі баз даних і електронних таблиць. До них також належать Expert Systems (експертні системи), бази знань яких містять бази фактів і бази правил і тому входять безпосередньо до Knowledge Based System (заснованих на знаннях систем) і до Artificial Intelligence. Провідні Web сайти за цією тематикою і виробники інструментів Business Intelligence дають багато подібних визначень, які підкреслюють різні особливості систем чи рекламованих програмних комплексів та платформ Орієнтовно з 2007 р. почали визначати Business Intelligence 2.0, а з 2010 р. – Business Intelligence 3.0 або Business Intelligence/Cloud Computing.

Ймовірно, дещо таємнича й інтригуюча назва «Business Intelligence» зіграла значну маркетингову роль у підтримці поширення цього комплексу концепцій, технологій та програмних засобів автоматизації інформаційно-аналітичної роботи й управління. Додає інтригу також привід різного тлумачення і перекладу терміну “Business Intelligence”: «бізнес-розвідка», «бізнес-інтелект», «бізнес-аналітика», «ділова аналітика», тощо.

Одночасно, лінгвістична псевдо подібність терміну “Business Intelligence” до бізнес-розвідки стримує реалізацію і розвиток цієї hi-tech у багатьох ділових сферах, насамперед, у некомерційних сферах на пострадянському просторі. Проте, дефініція «Business Intelligence» має таке ж відношення до сфери розвідувальної діяльності, як і до будь-якої іншої сфери ділової діяльності, які H. P. Luhn позначив узагальненим терміном Business. Фактично, Business Intelligence є основою DSS 2.0 (СППР 2-го покоління). На авторський погляд, орієнтовно з 2010 р. можна визначити нове покоління цих комп’ютеризованих систем, яке можна позначити DSS 3.0 або DSS/Cloud Computing, що відповідає Business Intelligence 3.0 або Business Intelligence/Cloud Computing.

Також, краще зрозуміти сутність дефініції “Intelligence” у сфері автоматизації інформаційної діяльності дозволяє розгляд відповідних лінгвістичних кластерів у частотних англо-українських словниках. Для прикладу, в English-Ukrainian Technical Dictionary слово “Intelligence” є основою слідуючих похідних слів або словосполучень: “Artificial Intelligence”, “Intelligence System”, “Intelligent”, “Intelligent Database”, “Intelligent Graphic”, “Intelligent Interface”, “Intelligent Keyboard”, “Intelligent Recalculation”, “Intelligent Terminal”, “Intelligent Token”, “Intelligibility”, “Intelligibility-Enabling Factor”, “Intelligible”, “Machine Intelligence”. Переклади слів не подані, тому що вони багатозначні.

Вживають також термін “Intelligent document” – для позначення інтерактивного електронного документу.

До семантичної мережі зв’язаних з «Intelligence» термінів у сфері автоматизації інформаційної аналітичної роботи й управління відносяться також: Knowledge Based System, Knowledge Management System, Expert System, Decision Support System (DSS), DSS/BI (1.0, 2.0, 3.0), Spatial DSS/BI, Social Media DSS, Social Media DSS/BI, Social Media Spatial DSS/BI, OLAP, Knowledge Discovery and Data Mining, Text Mining, Sentiment Analysis, Opinion Mining, Performance Management, Visual Mining, ін.

Носієм “Свідомості” (“Intelligence”) є “Oрганізм” (“Organism“). Для сфери автоматизованих систем по спрощеній аналогії введений термін  «Ергатичний організм» (“Ergatic Organism“). Проблемні питання створення і застосування “Ергатичних організмів” розроблені д.т.н.  Павловим В.В. разом з колегами в Інституті кібернетики Української РСР – результати опубліковані у 1975 р., у монографії “Начала теории эргатических систем”.

На погляд автора, логічним розвитком “організмічного” підходу до дослідження, побудови і розвитку складних інформаційно-управляючих людино-машинних систем є «Мережевий ергатичний організм (Network Ergatic Organism, NEO). Цю форму організмів з ергатичною свідомістю (“Ergatic Intelligence”) можливо вважати удосконаленою формою соціальних систем, у якій аналітичні і виконавчі функції розділені між людьми і машинами, при чому значну частину функцій виконують алгоритмічно-програмні і виконавчі засоби. Прикладом початкової реалізації “Network Ergatic Organism” є “Network-Centric Systems” (“Мереже-центричні системи” (управління)). Ця концепція автоматизації сформована у Міністерстві оборони США на початку 1990-х років як “Network-centric warfare” (“Network-centric operations”,  “Net-centric warfare”) – мереже-центричні військові дії. У теперішній час концепція “Network-centric warfare” трасформована і стала основою для створення “Мереже-центричних систем управління” у різних ділових сферах.  Також, елементи “Мережевих ергатичних організмів” реалізовані у провідних інформаційно-пошукових системах у Web та в деяких інших  глобальних мережевих комп’ютеризованих системах. Адже ці системи мають людино-машинні функції збору і аналізу інформації за допомогою засобів Business Intelligence   (OLAP, Data Mining, Text Mining, Imace Mining, Sentiment Analysis, Opinion Mining, Dashboards, Scorecard, ін.) у поєднанні з функціями високо автоматизованого управління віддаленими програмно-апаратними засобами користувачів, які реалізовані за допомогою програмних агентів (модифікація програм, ін.). Очевидно, що подібно до цього можна реалізувати функції управління різномантними пристроями, що реалізується, для прикладу, у концепції “Home automation”, “smart home” (“Розумний дім”), тощо.

Необхідно зазначити, що у Радянському Союзі, на Україні, у м. Києві, в Інституті кібернетики Академії наук Української РСР, під керівництвом академіка В.М. Глушкова (лауреат Ленінської  і Державної премій СРСР, Герой Соціалістичної праці),  з 1964 р. до кінця 1980-х років розробляли проект ОГАС – (ОбщеГосударственная Автоматизированная Система сбора и обработки информации для учета, планирования и управлении народным хозяйством СССР). По масштабам і фінансуванню проект ОГАС мав перевищити космічний і атомний проекти СРСР разом узяті. ОГАС повинна була функціонувати у значній мірі як мережевий ергатичний організм і заснована на знаннях система. Для прикладу,  одна з її реалізованих підсистем об’єднувала більше 600-т експертів і 5000 параметрів. У первинному проекті  ОГАС було передбачено відміну паперових грошей і заміну їх електронними (на 40 років раніше сучасної реалізації). Проте, незадовільне фінансування  роботи наукових і науково-педагогічних працівників привело до тяжких наслідків у сфері розробки інформаційно-аналітичних hi-tech. До цього часу має місце відтік висококваліфікованих наукових кадрів за кордон – фізично чи віртуально. Тяжкі наслідки цього видно, для прикладу, на графіках, що ілюструють розповсюдження Business Intelligence у світі і в Україні: статичні графіки і динамічні графіки (завантаження потребує високої швидкодії мережі і комп’ютера). Ввічливе замовчування цих недоліків приводить до уповільнення виходу України із кризового стану.

Висновки.

У даній публікації коротко розглянуті деякі системні особливості дефініції “Intelligence”, показані її зв’язки з похідними і пов’язаними термінами.

Проведений аналіз показує, що дефініція «Intelligence» і значна частина пов’язаних з нею термінів відносяться до сфери розумової (інформаційної аналітичної) діяльності та до автоматизації її і управління. Локальною сферою застосування дефініції «Intelligence» є сфера розвідувальних служб, де ця дефініція трансформувалася і позначає більш широкі види діяльності, ніж інформаційна аналітична діяльність.

З’ясування змісту і системне використання дефініції Intelligence і пов’язаних з нею дефініцій для сфери автоматизації інформаційної аналітичної діяльності і управління є важливим початковим кроком, який дозволяє побудувати узгоджену систему концепцій, високих технологій (hi-tech) і засобів, що забезпечують підвищення реальної ефективності вирішення задач у всіх сферах, які H.P. Luhn позначив терміном Business (наука, технологія, торгівля, промисловість, правова діяльність, урядова діяльність, оборона і т. д.).

У свою чергу, це забезпечує перехід на рівень автоматизації інформаційної аналітичної роботи та управління, який характерний для організацій, що засновані на знаннях (Knowledge Based Organization). Масовий перехід всіх організацій у державі на такий рівень забезпечує перехід з простого рівня Інформаційного суспільства (Simple Information Societies) на більш високий рівень суспільства, яке засноване на знаннях (Knowledge Based Societies).

У короткій публікації неможливо розкрити всі особливості терміну «Intelligence» та пов`язаних термінів. Частково вони розкриті у попередніх друкованих і електронних публікаціях. Передбачені подальші публікації за цією тематикою – по мірі наявності вільного часу. Дана публікація може бути доопрацьована  до більш структурованої форми.

Про Microsoft, Білла Гейтса, Пола Аллена, Стіва Балмера.

Про Microsoft, Білла Гейтса, Пола Аллена, Стіва Балмера, ін. (версія “Корпорации монстров”, Майя Тавхелідзе).

Гіперпосилання на відео:

http://www.youtube.com/watch?v=3k8Zjol-jxY

Про Facebook і Марка Цукерберга

Про Facebook і Марка Цукерберга: версія програми “Корпорации монстров”, Майя Тавхелідзе (канал Россия24)

Гіперпосилання на відео:

http://www.youtube.com/watch?v=qlYKMViW1J0

Про Google, Ларрі Пейджа і Сергія Михайловича Бріна

Про Google, Ларрі Пейджа і Сергія Михайловича Бріна: версія програми “Корпорации монстров”, Майя Тавхелідзе (канал Россия24)

Гіперпосилання на відео:

http://www.youtube.com/watch?v=h0239NyCusM

Поширення Business Intelligence і Data Mining в Україні і світі.

Поширення Business Intelligence і Data Mining в Україні та в деяких інших країнах світу - на основі аналізу статистики використання аналогічних пошукових запитів у Google

Статистика використання у Google пошукових фраз на основі Business Intelligence і Data Mining в Україні та в деяких інших країнах світу

На графіках показана статистика використання у Google пошукових фраз на основі Business Intelligence і Data Mining в Україні, Австрії, Великобританії, Іспанії, Італії, Нідерландах, Німеччині, Польщі. Очевидно, що ця статистика ілюструє рівень інтересу користувачів Google до Business Intelligence і Data Mining і тому свідчить про поширення відповідних інформаційно-аналітичних  hi-tech.

Для перегляду більшої кількості статичних графіків потрібно кликнути тут.

Для перегляду динамічних графіків необхідно мати достатні апаратно-програмні ресурси і високошвидкісний доступ до Інтернету. Нормальна швидкість завантаження динамічних графіків – 5…10 секунд. Графіки будуються на основі динамічного (OLAP) агрегатування Big Data, тому Google може встановлювати обмеження на кількість завантажень за певний час певним користувачем. Отже, для перегляду більшої кількості динамічних графіків потрібно кликнути тут.

З графіків видно, що Україна почала активно відновлювати свій hi-tech інформаційно-аналітичний потенціал, зниження якого відбулося з причин незадовільного фінансування науки й освіти у попередні два десятиліття. Видно, що це мало тяжкі наслідки.

MyTest Web Blog: простий тест швидкості і глибини індексування пошукових систем у Web.

Під час пошуку у Web за допомогою конкретної пошукової системи необхідно знати, наскільки достовірно вона відображає нові публікації (сайти, блоги та записи на них).

Простий спосіб тестування – відкрити всі пошукові системи і ввести назву сайту (блогу), у якому періодично додаються нові записи (пости, нотатки). Чим швидше дана пошукова система індексує та показує користувачам нові публікації –  тим вона краща. Такий простий тест не замінює і не може бути заміненим більш витонченими тестами. Ефективність аналітичної роботи визначається не тільки використанням  hi-tech засобів, про які буде йти мова у нотатках далі, але й логікою здорового глузду, яка передбачає також використання  можливостей простих, доступних проте вельми ефективних засобів.

Натиснувши на подані нижче гіперпосилання, можна перевірити ефективність пошукових систем у Web за введеною фразою “Нотатки про Business Intelligence+”. Адже відомо, що нотатки існують і на сайті  можна перевірити, коли додані останні. Кожне гіперпосилання відкривається на новій вкладці браузера, що забезпечує зручне порівняння результатів пошукової видачі із фактичною наявністю записів на дату тестування. Спрощує індексування те,  що нотатки виконані на узгодженій з Web 2.0 CMS WordPress. Дещо ускладнює індексування те, що нотатки знаходяться у піддомені – фактично це сайт у сайті.

Після перевірки пошукових систем у Web за даним пошуковим терміном можна ввести свій пошуковий термін для відповідного тестування. Дані гіперпосилання можна також використовувати для переходу до відповідних пошукових Web систем, адже вони зібрані на одній сторінці, дозволяють зручно порівняти результати пошуку і побачити розвиток функцій пошукових систем.

Google

Ask

Bing

QWant

МЕТА 

Nigma

Yahoo!

Яндекс (Yandex) в Україні

Rambler

Mail.ru

Baidu

Результати порівняльного тестування  систем пошуку у Web станом на 02.06.2013  р.

Умови проведеного тесту: всі налаштування за замовчуванням;  використаний  браузер Google Chrome з очищеною історією пошуку у Web.

Найкращі результати показала пошукова система Google (13 записів на двох сторінках, релевантні і пертинентні на 100%), а також Ask (9 записів на 2-х сторінках блогу). Пошукова система Google відображала нові записи протягом кількох годин після їх створення.

Стабільно добрі результати показала пошукова система Bing (2 головні сторінки блогу).

Нестабільні результати показали Nigma (2 головні сторінки блогу, проте на 4-й і 6-й позиціях у пошуковій видачі);  МЕТА (2 головні сторінки, у тому числі головна сторінка блогу і семантична карта сайту). Нестабільність пошукової видачі полягала у тому, що Нотатки відображалися не завжди. Можливо, це зв’язано з особливостями стратегії видачі пошукових результатів. Інші пошукові системи не знайшли відповідних записів, що  існували більше 3-х  тижнів. Пошукові системи російського походження  видали в основному однакові супутні релевантні публікації просвітницького характеру  на російській мові. Очевидно, що вказані недоліки підривають довіру до надійності знаходження цими системами наявних записів у Web, адже такі самі результати можуть бути і з іншими пошуковими термінами.

Не дивлячись на явні переваги пошукової системи Google, вона не може замінити інші системи у повному обсязі, адже кожна з них має свої часткові корисні функції, як розвинені краще. Тому для інформаційного пошуку ці системи доцільно використовувати ситуативно, але обов’язково після Google.

У пошукових системах у Web необхідно забезпечувати при формуванні результатів пошуку їх високу релевантність і пертинентність, наукову і практичну новизну і цінність, зв’язок зі світовими й регіональними результатами, інтереси рекламодавців, ін.  У повному обсязі відповідні стратегії відомі тільки їх власникам і корегуються та удосконалюються час від часу.

Користувачі Web мають право на об‘єктивне порівняння пошукових систем  і їх вільний вибір!