История и антиистория. Критика «новой хронологии» академика А.Т. Фоменко
Шрифт:
Следующая схема дает представление о последовательности шагов метода:
хроника -> числовая последовательность («информация») -> набор максимумов
На первом шаге текст с погодным изложением преобразуется в последовательность чисел, каждое из которых является функцией информации, содержащейся в хронике под данным годом. В качестве такой функции, по мнению автора, можно выбирать количество страниц, соответствующих каждой погодной записи, либо количество строк в записи, либо количество знаков, либо количество собственных имен в записи и т.д. Критический анализ этих способов измерения информации у автора полностью отсутствует, хотя очевидно, что они зависят от языка хроники, характера излагаемых событий, а число строк или страниц — даже от формата издания, что особенно сказывается в коротких записях. В нашей работе мы, стараясь
Второй шаг метода состоит в определении «локальных максимумов» для указанной выше последовательности чисел. Именно наборы максимумов хроник и будут сравниваться в последующих процедурах. Тем самым постулируется принцип — если наборы максимумов информации в хрониках совпадают, то эти хроники описывают один и тот же период времени. Опять-таки заметим, хотя этот принцип, мягко говоря, спорен с исторической точки зрения. Ведь история — это не просто набор замечательных дат, а такой принцип полностью отвергает сравнение содержательной стороны событий. Однако, здесь мы не будем углубляться в его критику, а примем предположения Фоменко «как есть».
Таким образом, на третьем шаге из двух исходных сравнивавшихся хроник получают две последовательности дат — локальных максимумов этих хроник. Интересно, что автор не дает никакого определения, какую дату можно считать максимумом, т.е. насколько сильно информация, ей соответствующая, должна отличаться от информации за смежные годы. Вместо этого он предлагает проводить «сглаживание» исходной числовой последовательности, т.е. в каждой точке заменять исходное значение на среднее арифметическое для значений некоторого набора соседних с ней точек. [249] В результате сглаживания, по мнению автора, выявятся основные максимумы, причем каждый из них будет достигаться только в одном конкретном году.
249
Из 3-его издания (т.1, с. 376) становится ясно, что автор предлагает здесь простое 3-х точечное сглаживание, т.е. среднее арифметическое значений в самой точке и двух ее соседях. Однако, «сглаженные» функции объема хроник, которые он рисует, позволяют в этом усомниться — см. ниже.
Рис. 1.
Указанная математическая процедура вызывает следующие законные возражения: 1) преобразование информации путем «сглаживания» искажает информацию, содержащуюся в исходной хронике, и лишено всякого исторического смысла. Например, если в летописи после двух кратких погодных записей, дано, скажем, под 1152 годом описание похода некоего князя на половцев, в 1153 г. написано, что «бысть тишина», а в 1154 г. представлен, скажем, подробный рассказ о кончине князя, после чего опять записи краткие, то 1154 г. и является локальным максимумом информации (см. рис.). Но «сглаживание» изменит картину: здесь покажется, что после краткого описания похода 1152 г. следует некое более подробное сообщение, которое превосходит в объеме даже подробную повесть 1154 г., т.е. информация 1153 г. (в летописи — просто отсутствующая) вдруг окажется локальным максимумом; 2) совершенно необязательно максимум информации достигается только в одном конкретном году. Разве нельзя себе представить, например, двух или трехлетний поход, описанный равномерно, с одинаковой степенью подробности? К какому году тогда отнести «локальный» максимум?
Вместе с тем мы готовы согласиться с автором — все эти искажения не слишком сильно нарушают общую картину распределения информации и выбор максимумов. Однако, они предоставляют значительный простор для привязки максимума к той или иной дате, т.е. допускают ошибку в его определении на несколько лет, что малозначительно само по себе, но играет большую роль при вычислении последующих «коэффициентов связи» хроник, которые чрезвычайно чувствительны к этим ошибкам. Как мы вскоре убедимся, достаточно несколько подвинуть максимумы в благоприятную сторону, чтобы на несколько порядков изменить «достоверность» совпадения хроник.
Мы, наконец, можем обратиться к центральной математической процедуре метода — сравнению наборов локальных максимумов. Обратим внимание, что с этого момента автор переходит от сравнения абсолютных дат локальных максимумов к сравнению относительных промежутков между ними. Максимумы делят полный отрезок времени, охватываемый хроникой, на несколько частей, и набор длин этих промежутков между максимумами автор обозначает Xi для первой и Yi для второй хроники. Очевидно, что чисел в этом наборе на единицу больше, чем числа максимумов (например, три максимума делят хронологический отрезок на четыре части). Но самое главное: хроники, у которых относительное расположение наборов максимумов полностью совпадает, обладают одинаковыми последовательностями Xi и Yi, т.е.
Ясно, однако, что в действительности корреляция максимумов у разных хроник, даже описывающих одни и те же события, не может быть полной. Поэтому статистическая задача автора — оценить выполнение соотношения (1) для рядов Xi и Yi (т.е. найти «степень близости» хроник) с помощью некоторой математической процедуры.
Отметим, что искомая связь (1) имеет предельно простой вид, она линейна, следовательно для ее оценки годится практически любой из существующих в статистике коэффициентов взаимосвязи. Приведем только два из них: коэффициент линейной корреляции (это самый известный и распространенный из статистических коэффициентов) и коэффициент регрессии, который находят по методу наименьших квадратов.
Коэффициент линейной корреляции рядов Xi и Yi вычисляется по формуле:
В случае существования линейной связи r по модулю близко к единице, в обратном случае — к нулю. Важно, что коэффициент имеет уровень значимости, т.е. такое значение, начиная с которого можно уверенно говорить о существовании корреляции:
где n — число членов рядов Xi и Yi, а число t определяется вероятностью, с которой мы хотим быть уверены в значимости корреляции (например, для 50% уверенности в существовании связи t = 0.6, для 99% — t = 3).
Коэффициент регрессии по своему смыслу — это угловой коэффициент прямой, которая наиболее близко проходит через точки с координатами (Xi, Yi). Когда все n точек не лежат на одной прямой, ее проводят так, чтобы сумма квадратов расстояний от этих точек до прямой была минимальной. Формула для коэффициента регрессии более сложна, чем для линейной корреляции, поэтому мы ее не приводим, подчеркнем только, что и здесь важна мера ошибки коэффициента регрессии, т.е. насколько хорошо указанные точки «ложатся» на прямую линию. Значения коэффициентов регрессии и линейной корреляции хорошо согласуются между собой — если коэффициент корреляции показывает наличие линейной связи переменных, то и ошибка коэффициента регрессии мала и наоборот.
Почему же автор не использует эти или иные статистические коэффициенты для оценки связи (1)? Мы не найдем в его книге ответа на этот вопрос. Вместо известных коэффициентов А. Т. Фоменко вводит свою собственную меру близости для рядов максимумов Л(X, Y). С его точки зрения, эта мера носит вероятностный характер, т.е. определяет «вероятность случайного совпадения лет» в сравниваемых рядах (мы чуть ниже проанализируем это утверждение). Впрочем, чем бы она ни была, если эта мера вводится корректно, то ее результаты должны согласовываться с приведенными выше коэффициентами.