От Network-Centric к Big Data – смена моды или закономерное развитие технологий? | Мнение специалиста от 16 августа 2014 года | Конструктивная кибернетика

От Network-Centric к Big Data – смена моды или закономерное развитие технологий?


Данная заметка продолжает цикл публикаций освещающих различные аспекты сетецентрических технологий. Ранее на нашем web-сайте уже были опубликованы три коротких сообщения по этой теме:

  • Введение в сетецентрические информационно-управляющие системы. Читать...

  • Парадигма сетецентрического управления – современный взгляд. Читать...

  • Сетецентрические технологии – границы области адекватности. Читать...

Мотивацией к продолжению освещения тематики сетецентризма, после достаточно долгого перерыва, послужили три обстоятельства. Во-первых, выше цитированные заметки оказались весьма востребованными у читателей. К удивлению автора на эти короткие сообщения даже появились ссылки из научных докладов и статей. Во-вторых, на наш web-сайт регулярно заходят по поисковым фразам содержащим в том или ином виде отсыл к сетецентрическим технологиям. А это значит что тематика жива. Но основная причина всё же иная, и она тесно перекликается с темой настоящего сообщения. Итак, подробности ниже.

Анализ открытых источников информации показал, что примерно на рубеже 2012 года интерес научной и инженерной общественности к всевозможным сетецентрическим системам стал резко угасать (здесь имеются в виду зарубежные R&D исследователи, инженеры, группы и центры, ибо с отечественными – ситуация прямо противоположная). И на первый план стали выходить технологии так или иначе связанные с Big Data (Большими Данными). Опять же, активный интерес к Big Data отечественные исследователи и инженеры начали проявлять с конца 2013 года.

Таким образом, возник закономерный вопрос, фактически вынесенный в заголовок настоящей заметки. Смена приоритетов между Network-Centric и Big Data – это просто совпадение, изменчивость моды или всё же закономерное развитие технологий? Многие специалисты посчитали, что это просто технологический тренд сменил траекторию, и одна «модная фишка» вытеснила другую. Тем не менее, не отвергая определённой доли подобного сценария, мы более склонны считать, что на самом деле переход инженерной и исследовательской активности от Network-Centric к Big Data – это закономерность. И вот почему.

Сетецентризм, как собирательную технологию, в виде концепции «сетецентрической войны» в оборот ввели вице-адмирал ВМС США Артур Себровски и профессор Джон Гарстка. Опубликованная ими в журнале «U.S. Naval Institute Proceedings Magazine» в январе 1998 года статья «Сетецентрическая война: её происхождение и будущее» стала своеобразным манифестом новой концепции. С этой статьи начался публичный этап нового модного направления: Network-Centric.

Модный тренд на технологию Big Data сформировался существенно позднее. В теории всё началось в 2008 году с интереса к феномену Big Data авторитетного научного журнала Nature. На практике – в 2010 году, когда компания Google передала Apache Software Foundation права на использование технологии MapReduce в составе Apache Hadoop.

Конечно, определённый фон по технологиям Network-Centric и Big Data существовал и до описанных событий, но они оказали, в определённом смысле, решающее влияние. Примечательно, что между отмеченными вехами прошло около 10-ти лет.

Примерно в 2011 году в мировой практике были реализованы достаточно крупные фрагменты полноценных глобальных информационно-управляющих систем, отвечающих парадигме сетецентризма. Специалисты думали, а обыватели были уверены, что ещё совсем чуть-чуть и глобальные системы можно будет тиражировать «пачками», а их функционал будет ограничиваться только фантазией Заказчика и его платежеспособностью.

Глобальная сетецентрическая информационно-управляющая система.

Однако чуда в очередной раз не произошло, жизнь вновь внесла свои коррективы. При отработке задач по развёртыванию, эксплуатации и эффективному применению крупных фрагментов полноценных глобальных информационно-управляющих систем, специалисты столкнулись с рядом критических проблем. И широким фронтом встали вопросы, как раз увязанные на проблематику Больших Данных и Больших Вычислений.

Как наверное знает читатель, чтобы система была отнесена к классу Big Data, недостаточно только гигантского объёма данных и высокого темпа их поступления в систему. Важный критерий – это неструктурированность и гетерогенность поступающих в систему данных. Более того, математическая обработка этих данных предполагает существенно больше, нежели дескриптивная статистика, регрессионный анализ или метод главных компонент.

Методы и алгоритмы Больших Вычислений ориентируются на глубокую обработку данных, пытаясь выяснить не только статистически значимые закономерности, но и построить содержательные модели явления (объясняющую, предсказательную). При этом в качестве сырых данных алгоритмам обработки отдаются, в большинстве случаев, абсолютно неформализованные тексты написанные на естественном языке, звуковые и видеопоследовательности, графические данные. Таким образом, тренд по обработке Больших Данных лежит в области осмысления, понимания сути явления, выраженного в массиве неструктурированных и гетерогенных данных. И в качестве результата вычислений, потребитель, как правило, желает видеть не график и/или формулу описывающие происходящие процессы. Он желает оперировать результатами решения задачи на языке, близком к естественному языку, понятному не математику, а специалисту из конкретной предметной области, будь то медик, финансист, дизайнер, композитор или искусствовед. А это уже область слабого искусственного интеллекта. Конечно, весьма правильный вопрос: насколько подобная обработка Больших Данных может быть успешно реализована (и в каких случаях)? Но, к сожалению, освещение этого момента выходит за рамки настоящей заметки.

С другой стороны, как известно, в основе сетецентрических информационно-управляющих систем (ИУС) лежит так называемая «Глобальная информационная решётка» (ГИР, GIG – global information grid). Под этим понятием понимается не только вертикальная интеграция между источниками информации, узлами принятия решения и исполнительными органами, но и широкое развитие горизонтальных связей между разнородными поставщиками, обработчиками и потребителями циркулирующей в ИУС информации. А в ИУС как раз и циркулируют данные различных типов, по большей части неструктурированные, представленные от разнородных источников информации.

Матричная организация глобальной информационной решётки.

Как уже ранее нами отмечалось (в одной из прошлых заметок), разнородность информации циркулирующей в сетецентрических ИУС, событийно-командный (вербально-семантический) характер многих данных порождает насущную потребность в весьма широком наборе специфических алгоритмов обработки информации и принятия решения. Сетецентрические ИУС, одни из самых активных «потребителей» методов построения логико-вероятностных моделей сложных объектов и/или явлений в трудноформализуемых областях человеческой деятельности. Весьма востребованы методы количественного анализа разнотипной эмпирической и феноменологической информации, которая может быть представлена как многомерными таблицами, многомерными временными рядами и полями, так и набором вероятностных экспертных высказываний (суждений) об объекте исследования. Причём методы обработки данных и принятия решения должны порождать устойчивые и состоятельные оценки при слабых предположениях о классе распределений, малых объёмах выборки (в том числе с искажёнными и/или отсутствующими данными). И главное – они должны представлять результаты решения на языке, близком к естественному языку логических суждений.

Далее, сопоставить проблематику Network-Centric и Big Data, и сделать соответствующие выводы по заметке, внимательный читатель вполне может сам. Ну и в качестве дополнительной информации к размышлению. В 2012-13 годах правительство США обязалось выделить на National Science Foundation, National Institutes of Health, Department of Defense, Department of Energy и US Geological Survey свыше $200 млн. на R&D проекты, так или иначе связанные с Big Data, Big Computation, Big Visualization, Big Analytics (подробнее). И достаточно оперативно начало исполнять это решение, финансируя исследовательские проекты по машинному обучению в области Больших Вычислений (подробнее).


Данный документ распространяется на условиях лицензии: «Attribution-NonCommercial-NoDerivs» («Атрибуция – Некоммерческое использование – Без производных произведений») CC BY-NC-ND 3.0 Непортированная.


16 августа 2014 года.

Андрей Макаренко,
группа «Конструктивная Кибернетика».

Обсуждение: contact@rdcn.ru

Ключевые слова: Network-Centric, Big Data, Большие Вычисления, тренд, искусственный интеллект.