Достаточно общая теория управления
Шрифт:
ПРОГРАММНО-АДАПТИВНОЕ УПРАВЛЕНИЕ
Внешние обратные связи в системе есть. Управляющий сигнал является функцией реальных параметров внешней среды и замкнутой системы, информация о которых поступает по цепям внешних и внутренних обратных связей. Но в то же время управляющий сигнал является и однозначной функцией программы (закона управления) в том смысле, что одинаковой информации, поступающей по цепям обратных связей, всегда соответствует один и тот же управляющий сигнал. Эту тождественность реакции «вход – выход» можно понимать и в смысле соответствия статистических характеристик управляющего сигнала информации, поступающей по цепям обратных связей. Реакция системы на возмущение до некоторой степени гибкая в том смысле, что управляющий сигнал и реакция замкнутой системы на возмущения – функция этих возмущений.
Программно адаптивная схема может реализовывать разные принципы управления. Отметим два наиболее
Предположим, что мы проектируем систему автоматического управления температурным режимом в помещении. Мы можем построить её так, что обогреватели будут включаться в результате регистрации системой падения температуры в помещении ниже заданного значения. Это будет реализацией принципа управления по отклонению. Но мы можем построить систему такого назначения и иначе. Поскольку температура в помещении обычно падает после того, снизится среднесуточная температура наружного воздуха, остынут стены помещения и в него попадёт холодный наружный воздух, то мы имеем возможность регистрировать температуру наружного воздуха, вычислять среднесуточную температуру, и, не дожидаясь того момента, когда стены остынут и начнётся снижение температуры в помещении, давать команду на включение обогревателя в каком-то режиме немедленно в случае снижения среднесуточной температуры до заданного порогового значения. Кроме того, режим функционирования обогревателя может быть функцией разницы среднесуточной наружной температуры и текущего значения температуры в помещении. В последнем варианте в программно-адаптивной схеме управления будут сочетаться оба принципа управления – по возмущению и по отклонению.
Если нет возможности измерять контрольный параметр непосредственно в процессе управления (то есть в отношении него разорваны внешние и внутренние обратные связи), то в таком случае вместо не поддающегося непосредственному измерению значения контрольного параметра может быть использована его косвенная оценка на основе его производных, интегральных и иным образом информационно с ним связанных параметров, которые измеряются непосредственно. Однако в этом случае программно-адаптивное управление имеет свойство неограниченно накапливать с течением времени ошибку рассогласования по контрольному параметру. Причина неограниченного накопления ошибки управления по контрольному параметру – накопление ошибок измерения и преобразования измеренных величин в процессе косвенной оценки необходимой характеристики.
Примерами такого рода ошибок полна летопись морских катастроф, когда навигаторы, не видя берега в течение многих недель, из-за плохой погоды не видя звезд, вынуждены были определять место корабля по счислению (на основе расчетов), и из-за ошибок в измерении скорости хода, ошибок в оценке влияния ветра и течений, неточности хода корабельных хронометров (часов) и ошибочного показания компасов теряли точные координаты (место) и гибли на камнях, которые по их расчетам должны были находиться за много миль от них. Таков же механизм накопления ошибок инерциальными навигационными системами, употребляемыми в ракетно-космической технике, на подводных лодках и системах оружия, в которых текущие координаты объекта определяются на основе ввода исходных координат, измерения ускорений и их двукратного интегрирования.
Качество управления при употреблении программной схемы ниже в сопоставлении с программно-адаптивной при одинаковой алгоритмике моделирования поведения объекта, положенной в основу формирования управляющего сигнала. Но и возможное качество управления при программно-адаптивной схеме может оказаться ниже минимально необходимого уровня в сложившихся условиях.
Допустим, что в какой-то момент времени вектор ошибки управления равен нулю. Но в какой-то момент времени, даже в тот же самый, замкнутая система будет подвергаться ненулевому возмущающему воздействию. Если бы в состав замкнутой системы входила идеальная система управления, то она формировала бы управляющий сигнал так, что управляющее воздействие в каждый момент времени в точности компенсировало бы возмущающее воздействие, вследствие чего вектор ошибки управления сохранял бы своё нулевое значение неограниченно долгое время.
Но в большинстве случаев возмущающее воздействие прямому измерению не поддаётся. Но даже если что-то и возможно измерить, то существует порог чувствительности средств измерения величин всех факторов, на основе информации о которых формируется управляющий сигнал. Информация при передаче искажается в некоторых пределах в самой системе. Системе управления требуется время на формирование и передачу управляющего
Потребность уменьшить вектор ошибки управления приводит к схеме «предиктор-корректор» – предуказатель-поправщик, предсказатель-поправщик. Смысл слова «предуказатель» объемлет смысл слова «предсказатель», но на Западе и в отечественной научной традиции уже принят термин «предиктор-корректор», однако не в общем управленческом смысле, а в ограниченном: в технике и вычислительной математике [36] . Поэтому мы, оговорив по-русски особенности нашего понимания – «предуказатель-поправщик», а не «предсказатель-поправщик» – сохраняем уже прижившееся на Западе термин «предиктор-корректор», однако расширив область его применения введением в контекст достаточно общей теории управления.
[36]
Термин «предиктор-корректор» – название одного из методов вычислительной математики. В нем последовательными приближениями находится решение задачи. При этом алгоритм метода представляет собой цикл, в котором в последовательности друг за другом выполняются две операции: первая – прогноз решения и вторая – проверка прогноза на удовлетворением требованиям к точности решения задачи. Алгоритм завершается в случае, когда прогноз удовлетворяет требованиям к точности решения задачи.
УПРАВЛЕНИЕ ПО СХЕМЕ ПРЕДИКТОР-КОРРЕКТОР
Оно строится на основе прогнозирования в самом процессе управления поведения замкнутой системы, исходя из информации о текущем и прошлых состояниях замкнутой системы и воздействии на неё окружающей среды. Прогнозная информация подаётся на вход программно-адаптивного модуля системы управления. Вследствие этого система управления реагирует не только на уже свершившиеся отклонения замкнутой системы от идеального режима, но и на те, которые только имеют тенденцию к осуществлению (в случае, если прогнозирование достаточно точное). Если программно-адаптивное управление замыкает прямые и обратные связи через уже свершившеесяпрошлое, то в схеме предиктор– корректор некоторая часть прямых и обратных связей замыкается через прогнозируемоебудущее. Информация о свершившемся прошлом и о настоящем в схеме предиктор-корректор, кроме прогнозирования и выработки управляющего сигнала, также используется как основа для минимизации (периодического обнуления) в процессе управления составляющей вектора ошибки, обусловленной накоплением с течением времени ошибок прогнозирования.
При сопоставлении программно-адаптивной схемы и предиктора-корректора на основе вектора состояния,используемого программно-адаптивной схемой, одному и тому же вектору состояния в схеме предиктор-корректор будут соответствовать разные управляющие сигналы, поскольку в основе прогноза предиктора-корректора лежит вектор состояния большей размерности, чем в программно-адаптивной схеме. На основе информации, выходящей за пределы тождественной части векторов состояния, используемых в обеих схемах, предиктор-корректор будет получать разные прогнозы, что и выразится в несовпадении управляющих сигналов, вырабатываемых в программно-адаптивных модулях обеих схем управления. То есть предиктор-корректор «умнее» и обеспечивает более гибкое, нешаблонное управление по сравнению с предыдущими схемами.