Идентификация объектов – с чего начинать?
Как явственно видно из названия, данная заметка будет посвящена идентификации. Из определения этого термина следует, что означенная процедура носит центральный характер не только в кибернетике, или современной теории автоматического управления. Любые задачи, требующие для своего решения получения математической модели реального процесса, системы – так или иначе связаны с идентификацией.
Как показывает анализ информационных источников, обсуждаемому вопросу посвящено громадное количество журнальных статей, докладов, монографий и учебников. В них зачастую подробно, обстоятельно и на высоком уровне строгости рассматривается: как проводить идентификацию объекта; какие методы анализа и в каких случаях применять; как избегать типичных и скрытых ошибок; как ставить корректный эксперимент для получения исходных данных, и т. п. И тем не менее, очень часто встречаются люди (даже целые коллективы), которые берясь за решение задачи идентификации, не представляют с чем имеют дело, с чего им начинать, а где заканчивать. Порой они даже не понимают, что решают задачу идентификации, придумывая своим действиям всяческие экзотические названия, а следовательно, не владея общепринятой терминологией, не могут найти информацию. Начинают «изобретать велосипед», или «делать как умеют», без должной постановки задачи. Конечно эти подходы ни в коем случае нельзя считать конструктивными, а потому их авторам надо показывать как это делать правильно.
Глубина и широта вопросов, связанных с задачами идентификации реальных объектов (процессов, систем, режимов функционирования, управления), такова, что уместить весь материал в одной заметке не получится, поэтому ограничимся самым началом – осветим основные шаги решения задачи идентификации. Итак, будем считать – объект у нас есть, а цель построения его модели определена. Без этих исходных предпосылок, все дальнейшие рассуждения бессмысленны.
Первым шагом всегда идёт структурная декомпозиция анализируемого объекта: выделение внешней среды, внешних систем, оконтуривание самого объекта, определение между ними всеми связей. Даже если исследователь работает в слабо формализуемой области (медицина, психология, социология, политология, и т. п. дисциплины), он всё равно обязан провести структурную декомпозицию, хотя бы на феноменологическом уровне.
Как Вы думаете, что нужно делать дальше? Как ни странно, масса «горячих» голов сразу же кидается проводить эксперимент. Причём встречаются индивидуумы (и отдельные группы «специалистов»), которые сразу же затевают полномасштабный эксперимент. Нарабатывают материал, и думают что «дело в шляпе»: «... данных получено много, сейчас мы их обработаем, и ответим на интересующие нас (Заказчика) вопросы!». Далее либо формулирование неверных выводов, либо следующая «безумная» итерация экспериментов. В общем как говорил Вольфганг Паули (швейцарский физик-теоретик, лауреат Нобелевской премии по физике, 1900-1958 г.): «Это даже не неправильно.». Так вот, чтобы избежать этой ситуации, необходима иная последовательность действий.
Вторым шагом должен быть анализ наблюдаемости идентифицируемого объекта. Важность и смысл этого этапа показаны ранее, в сообщении от 29.01.2010 г. Проанализировав наблюдаемость объекта, в первом приближении, возможно сформировать перечень, оценить значимость и доступность для измерений переменных состояния трёх базовых составляющих (объект, внешние системы, внешняя среда). При формировании вектора наблюдения необходимо, в обязательном порядке, оценивать следующие характеристики содержащейся в нём информации: информативность, достоверность, полнота, избыточность, актуальность, доступность. Необходимо отметить, что с анализом наблюдаемости тесно связан следующий этап решения обсуждаемой здесь задачи.
Третий шаг – собственно построение априорного варианта модели, детализация задачи идентификации. Этот этап основан на перекрёстной классификации задачи по целому ряду признаков. В числе основных:
Априорная информированность об объекте: чёрный, серый, белый ящик. Здесь необходимо отметить тот факт, что если разделение на объект/системы/среда провести возможно – значит исследователь уже работает не с чёрным ящиком, а, следовательно, должен по максимуму использовать всю доступную априорную информацию об изучаемом объекте.
Глубина идентификации: параметрическая, непараметрическая, структурная. Этот классифицирующий признак вытекает из цели построения модели и сильно связан с априорной информированностью исследователя касаемо свойств объекта.
Форма описания объекта: в пространстве состояний, в пространстве сигналов. Как правило, форма пространства состояний оперирует вектором состояния и подразумевает применение математического аппарата дифференциальных уравнений. Форма пространства сигналов обычно задаёт пару векторов: входное (управляющее) воздействие, выходная реакция, и применяет либо интегральные преобразования, либо интегральные уравнения.
Форма представления векторов состояний, сигналов: в пространстве оригиналов, в пространстве изображений. Классически, на языке оригиналов составляются уравнения: дифференциальные, интегральные, алгебраические. А на языке изображений – интегральные преобразования: Лапласа, Фурье, z-преобразование, вейвлет-преобразование, и т. д.
Форма задания времени в модели: непрерывное время, дискретное время. В случае дискретного времени надо понимать чем вызвана эта дискретность: природой сигнала – так называемые решётчатые процессы, или условиями наблюдения – применение, к примеру, АЦП (аналого-цифрового преобразования). Дискретизация отсчётов возможна как эквидистантная, так и неэквидистантная. От этого зависит выбор и способ применения математического аппарата моделирования.
Форма задания компонентов векторов состояний, сигналов в модели: сильные, слабые шкалы, дискретное, континуальное поле значений. Нужно опять же понимать чем обусловлен выбор того или иного представления вектора состояния или сигнала: природой объекта, или ограничениями накладываемыми наблюдателем.
Учёт фактора случайности: детерминированная постановка задачи, стохастическая постановка задачи. В принципе, любой реальный объект функционирует в стохастических условиях, подвержен влиянию случайных факторов, помех. Весь вопрос в том, можем ли мы пренебречь их влиянием, оставаясь в области допустимого снижения качества моделирования.
Учёт нелинейности объекта в модели: линейная модель, нелинейная модель. Нелинейные модели существенно сложнее линейных, требуют нетривиального математического аппарата (исключение кусочно-линейная постановка задачи). С другой стороны, нелинейные модели позволяют обнаруживать специфические режимы функционирования сильно нелинейных объектов.
Учёт нестационарности объекта в модели: стационарная модель, нестационарная модель. Нестационарность в свою очередь возможна как параметрическая, так и структурная (системы с переменной структурой). Отметим, что нестационарные модели не только сложнее стационарных, но и более затратны с точки зрения проведения эксперимента. В этом аспекте надо тщательно соблюдать баланс желаний и возможностей.
Способ идентификации: активная идентификация, пассивная идентификация. В случае активной идентификации, подразумевается что объект выведен из режима штатного функционирования и на него могут быть поданы произвольные воздействия, расширяющие диапазон его наблюдаемых состояний. Если производится пассивная идентификация, специфические – зондирующие воздействия на объект не оказываются. Возможно применение смешанного режима, когда объект остаётся под рабочими входными (управляющими) воздействиями, но к ним примешиваются зондирующие сигналы.
Типы входных зондирующих воздействий: шум, дельта-импульс, ступенька Хевисайда, линейно нарастающий сигнал, гармоническое воздействие. Тип входного воздействия подбирается для максимального расширения наблюдаемых состояний объекта, исходя из природы самого объекта, возможностей эксперимента и применяемого математического аппарата.
Критерий качества идентификации. Один из самых немаловажных пунктов. Но ему зачастую уделяют мало внимания,а именно он определяет адекватность модели, и область её адекватного применения.
И только на четвёртом шаге проводится эксперимент. Но не полномасштабный, а тестовый. Для апостериорной проверки сформированных на третьем и втором шагах представлений. Ибо условия апостериорной наблюдаемости оказывают определяющее влияние на структуру математической модели объекта идентификации и тактику эксперимента. Надо быть готовым к тому, что по результатам этого этапа может даже корректироваться структурно-функциональная модель объекта (шаг первый). И только когда все грубые шероховатости сглажены, можно переходить к следующему уровню исследований.
Шаг пятый – полномасштабный эксперимент. Наработка массива результатов, по которым собственно и идёт построение апостериорной модели. В общем-то этот шаг, как правило, тоже неоднороден и итеративен.
Из особенностей экспериментального этапа (полномасштабного и тестового) необходимо отметить следующее – корректный эксперимент вещь во всех отношениях затратная. Поэтому не надо экономить на метрологическом обеспечении – расходы всё равно окупятся. В качестве рекомендации по снижению затрат (временных, финансовых): применяйте теорию планирования оптимального эксперимента! Не обязательно во всей её теоретико-множественной полноте, но хотя бы следуйте её базовым положениям.
На шестом шаге – математика, математика, и ещё раз математика. Вычислительная техника и численные методы предстают во всей своей красоте и мощи. И не забываем про статистику и теорию измерений. Этот этап – практически финал. Исследователь строит апостериорную модель, настраивает её, проверяет её адекватность. Зачастую именно на этом рубеже происходят как мелкие стычки, так и обширные войны между приверженцами теоретического подхода и апологетами эксперимента. Каждый пытается утянуть одеяло на себя. Теоретики – предлагают «чистый» подход на основе законов математики и соответствующих отраслей науки, с привлечением интуиции. Практики – во главу ставят эксперимент, и считают, что могут обойтись простыми математическими построениями, в стиле «инженерных методик». Такое противопоставление теории и эксперимента неконструктивно в той же мере, как и противопоставление дедуктивного и индуктивного методов познания.
В действительности успех в решении задачи идентификации во многом зависит от двух составляющих: удачно выбранного языка описания и структуры математической модели и грамотно поставленного, корректного эксперимента. Причём эти две составляющие целиком базируются на априорных представлениях об объекте. Нужно помнить, что чисто эмпирический подход менее плодотворен, нежели подход основанный на сочетании теоретических положений и экспериментальных данных. Даже в случае феноменологических моделей, этот подход представляется целесообразным.
В качестве заключения. Конечно приведённая здесь последовательность действий при проведении идентификации реальных объектов не может считаться универсальной и абсолютно полной. За кадром остались такие специфические вопросы, как идентификация слабоформализуемых, слабонаблюдаемых объектов. Весьма нетривиальная задача – пассивная идентификация с доступным однократным измерением. А чего стоит постановка задачи идентификации в реальном времени? Тем не менее, приведённый алгоритм действий должен помочь специалистам, открывающим для себя эту область, не совершить грубые ошибки, сразу включиться в работу, и главное – он даёт представление о направлении поисков информации для ответов на проблемные вопросы. Что касается специфических случаев – это тема отдельного разговора. Обращайтесь!
04 марта 2010 года.
Андрей Макаренко,
группа «Конструктивная Кибернетика».
Обсуждение: contact@rdcn.ru
Ключевые слова: идентификация, математическая модель, объект, система, процесс, эксперимент.