Аналитика: методология, технология и организация информационно-аналитической работы
Шрифт:
Можно утверждать, что статистические модели представляют собой особый вид математических моделей, использующих в качестве исходных данных не только актуальные данные о текущем состоянии объекта, но и данные, характеризующие состояние либо других объектов данного класса, либо этого объекта, но в иной момент времени. Статистические модели применимы для изучения массовых явлений любой природы, включая и те, которые не относятся к категории вероятностно определенных (математическая статистика приспособлена и для решения детерминированных задач). При моделировании последних статистический процесс вводится в модель искусственно для получения статистических оценок численного решения (например, точности измерения параметров
Методы математической статистики и теории вероятности могут вводиться, в том числе, и в логические и логико-лингвистические модели, как это было указано в предыдущем подразделе. Например, могут рассматриваться методы интеграции статистических оценок в модели семантических отношений для придания различных весов дугам, связывающим отдельные вершины. Статистические оценки могут быть внедрены и в системы представления тезаурусов для разрешения ситуаций полисемии без обращения к процедурам контекстного анализа. Иными словами, статистические методы могут составлять как основу модели, так и применяться для модификации моделей других типов.
Для обработки результатов наблюдений используются методы корреляционного, регрессионного, факторного, кластерного и иных видов анализа, оперирующих статистическими гипотезами. Особая роль здесь отводится методу статистических испытаний (методу Монте-Карло). Это метод численного решения математических задач, основанный на многократном теоретико-вероятностном и статистическом моделировании случайных величин или процессов с целью построения статистических оценок для искомых величин. Сущность метода состоит в реализации многократного моделирования случайного явления с помощью некоторой процедуры, дающей случайный результат. Для этого с применением ЭВМ создается некоторое множество реализаций случайных процессов, моделирующих возмущающие воздействия на исследуемый объект или процесс, после чего производится моделирование этого процесса или объекта в условиях, определяемых полученными случайными воздействиями. Результаты такого моделирования обрабатывают с использованием методов математической статистики. При этом могут варьироваться тип и параметры распределения случайной величины.
Реализация случайного процесса методом Монте-Карло представляет собой последовательность розыгрышей единичных жребиев, перемежающихся обычными расчетами, в ходе которых определяется результат возмущающего воздействия на объект или процесс, на исход операции.
Поскольку адекватность модели распределения случайных воздействий в общем случае установить трудно, задачей моделирования с применением метода Монте-Карло является обеспечение робастности полученных решений (устойчивости к изменению параметров закона распределения случайных величин и начальных условий моделирования). Если результат моделирования не является робастным (существенно зависит от параметров закона распределения и параметров модели), то это свидетельствует о наличии высокого риска при принятии решения в данной реализации моделируемой системы.
Важную роль в статистических моделях играют гипотезы о характере процессов смены состояний в моделируемой системе. Так, например, весьма интересный случай представляет собой гипотеза о «марковости» процессов (получившая название в честь русского ученого А.А. Маркова — начало XX века). Марковские процессы представляют собой случай процесса с детерминированными вероятностями, для которого ранняя предыстория смены состояний системы на некотором предшествующем интервале времени несущественна для установления вероятности наступления следующего события — основное значение придается ее текущему состоянию. Если существует уверенность в марковости процесса, это существенно меняет представления о системе (она может рассматриваться как «инерционная», в большой степени зависящая от текущего ее состояния и характера возмущающего воздействия). Принцип марковости был открыт при анализе текстов на естественных языках, где вероятность появления следующего символа может быть предсказана на основе статистического анализа текстовых массивов, на данном конкретном языке.
Статистическое моделирование тесно сопряжено с имитационным моделированием, ходе которого модель объекта нередко «погружается в вероятностную (статистическую) среду», в которой проигрываются различные ситуации и режимы функционирования модели/объекта. Однако имитационные модели могут реализовываться и в детерминированных средах.
Методы статистического моделирования широко распространены в сфере стратегического планирования и управления. Широкому распространению методов статистического моделирования в сфере оперативного управления препятствует высокая трудоемкость процесса моделирования. В основном это связано с необходимостью глубокой математической проработки моделей и высокими требованиями, предъявляемыми к математическим познаниям пользователей.
2.7 Аналитические модели
Данный класс моделей обладает высочайшей степенью формализации описаний и применяется там, где закономерности протекания процессов и функционирования системы являются хорошо изученными, а сами процессы могут рассматриваться как детерминированные. Нередко аналитические модели справедливо отождествляются с моделями детерминированных процессов. Такие ограничения являются достаточно жесткими, что ограничивает сферу их применения системами, функционирующими в стационарных условиях (т. е. в малой степени подверженных влиянию случайных возмущающих воздействий) или требуют существенного упрощения модели. В качестве примера аналитической модели может рассматриваться модель невозмущенного движения объекта в космическом пространстве.
Аналитическое математическое моделирование — это вид моделирования, в ходе которого основная роль отводится аналитической математической модели, обладающей следующими особенностями:
— аналитическая модель строится на основе некоторой теории или научной гипотезы;
— модель описывает в целом определенный аспект моделируемой системы (процесс в системе) посредством различных математических конструкций (функций или функционалов, алгебраических или дифференциальных уравнений и т. д.);
— модель позволяет получать конечные результаты исследования в виде некоторых формальных соотношений, пригодных для производства количественного или качественного анализа.
Использование ЭВМ при аналитическом моделировании не является обязательным, но решение достаточно сложных задач, сформулированных аналитически, целесообразно сопровождать проведением численных исследований на ЭВМ. Для проведения этих исследований разрабатывается соответствующий алгоритм (алгоритмическая модель), реализующая его программа, формируется массив исходных данных, после чего выполняются расчеты.
Проведению аналитического моделирования может предшествовать построение концептуальной модели с целью установления того, какой именно теоретический аппарат целесообразно использовать для моделирования данной конкретной системы.
Важным достоинством аналитического моделирования является возможность получения на его основе фундаментальных результатов и инвариантных зависимостей, которые могут быть распространены как на различные случаи использования моделируемой системы в тех или иных ситуациях и распространены на случаи рассмотрения других систем данного класса.