История и антиистория. Критика «новой хронологии» академика А.Т. Фоменко
Шрифт:
Из графика видно, что Л(X, Y) не превосходит 1% при = 16 лет. Иными словами, все хроники на данном отрезке, в которых максимумы различаются не более, чем на 16 лет, можно считать совпадающими, с вероятностью случайного совпадения 1 шанс из 100. Не будем обсуждать с исторической точки зрения, могут ли хроники, описывающие одинаковые события, различаться во датировках на 16 лет (ответ, конечно, зависит от древности хроник), но обратим внимание, что эта ошибка превосходит половину среднего временного промежутка между последовательными событиями Xср = Yср = A/n = 30 лет. Итак, располагая события по хронологической оси, создатель хроники может допускать ошибки более 50% в определении каждого промежутка, и тем не менее хроники будут трактованы как совпадающие с вероятностью в 99%. Очевидно, что коэффициент Л(X, Y),
К чести автора, надо заметить, что вероятность 99% он еще не считает абсолютной для определения тождественности хроник, а существенно опускает границы значимости своего коэффициента. Это делается им на основании «вычислительного эксперимента». В частности, он замечает, что «для независимых текстов число Л(X, Y) колеблется от 1 до ? при количестве локальных максимумов от 10 до 15» (заметим, что в последнем случае, когда независимые тексты имеют ВССЛ равной 1/100, как раз и должно реализоваться одно «случайное совпадение» из 100!). Эти значения «разительно отличаются от типичных значений 10– 12 – 10– 6 для заведомо зависимых текстов (с аналогичным количеством максимумов)». [252] Из слов автора следует, что рассмотренный нами выше пример с Л(X, Y) <2x10– 6 (выбранный, как говорилось, наугад), на самом деле соответствует заведомо зависимым текстам! При этом, и в нашем примере максимальная ошибка D = 16 лет (хотя и достигается не по всем координатам) превосходит половину среднего расстояния между максимумами.
252
Фоменко А. Т. Методы статистического анализа нарративных текстов и приложения к хронологии. М., 1990. С. 110.
Приведенный нами пример, в котором пара хроник с отсутствующей по стандартным статистическим критериям корреляцией, тем не менее, соответствует зависимым текстам, не только говорит о завышенных автором уровнях значимости, но и вообще ставит под сомнение корректность оценок его «вычислительного эксперимента». Правда, чуть ниже автор еще раз оговаривается, что зависимыми можно считать тексты с коэффициентом меньше 10– 8. На нашем графике этому значению Л(X, Y) соответствует = 6 лет, т.е. определяя промежутки между узловыми событиями, наш хронист может ошибаться всего лишь на 20% от среднего расстояния между ними. И эта оценка также представляется нам завышенной: с точки зрения статистики разумно допустить не более чем 5% ошибку хрониста, которой на графике соответствует уровень значимости коэффициента, при данном числе максимумов равный 10– 16.
Обобщая вышесказанное, мы делаем вывод: «малые значения» коэффициента вытекают из самой его структуры (в частности сверхчувствительности к отклонениям), и еще не обеспечивают достоверности результата.
4) Наконец, мера близости оказывается не транзитивной, т.е. если точка X близка к точке Y, а точка Y — к точке Z, но в общем случае не всегда точка X близка к Z. Покажем это для коммутативных коэффициентов. Рассмотрим три «хроники» X, Y и Z, которые а) лежат на одной прямой в n– мерном пространстве, б) достаточно близко друг к другу и «глубоко» внутри множества Ш, чтобы их коэффициенты коммутировали, и в) так, что расстояния между X и Y и расстояния между Y и Z одинаковы и равны . Поскольку точки лежат на одной прямой, то тогда расстояние между X и Z будет равно 2.
Для коммутативных коэффициентов имеем Л(X, Y) = Л(Y, Z) = , где вычислено по формуле (8'). Мы можем положить, например, = 10– 8, и тогда хроники X, Y и Y, Z интерпретируются как «заведомо зависимые» (при числе максимумов от 10 до 15). Но, подставляя в (8') расстояние между точками X и Z, равное 2, получаем
что дает, скажем, в нашем модельном примере при 14 максимумах (n=15):
Итак, мера между X и Z отличается от меры точек-соседей более чем в 10 тысяч раз! Хотя пары X, Y и Y, Z считаются «заведомо зависимы», оценка связи X и Z находится далеко выше границы зависимых хроник, и приближается к значениям независимых. Отметим, что сам автор не только не оговаривает эти проблемы, но даже в своей книге неявно пользуется транзитивностью коэффициента, например, рассуждая о возможности продолжить книгу Тита Ливия учебником В. С. Сергеева (см. ниже). [253]
253
Приведенный пример еще раз показывает, что основные "неприятности" коэффициента Л(X, Y) возникают из-за того, что мера, предложенная автором, получена с помощью возведения евклидового расстояния ?(X, Y) между точками в некую "большую" степень. Между тем, это расстояние само по себе уже служит мерой близости точек, и для него выполняются свойства коммутативности и транзитивности ("неравенство треугольника"), математически это означает, что ? (X, Y) является метрикой пространства Rn. Мера же Л(X, Y), как мы показали, не является метрикой, именно поэтому в ее интерпретации как статистического коэффициента заключены серьезные проблемы.
Мы неоднократно упоминали «вероятность» случайного совпадения максимумов в хрониках, которую автор получает, вычисляя коэффициент Л(X, Y). Но очередное возражение, которые мы сейчас сделаем, состоит в том, что такая интерпретация Л(X, Y) является крайне неточной, и величина ее ошибки опять-таки сильно зависит от параметров A и n.
В самом деле, если эта интерпретация верна, необходимо, чтобы анализируя случайно выбранную хронику методом локальных максимумов, можно было с равной вероятностью получить любую точку из множества Ш, иначе говоря распределение «виртуальных» хроник (длины А лет) по множеству Ш было бы равномерно. Вот доводы автора: «Равномерность распределения случайного вектора C на множестве Ш может быть обоснована тем, что вектор С изображает точки максимумов функции объема »глав« текстов, описывающих заданный период (A, B), а поскольку наша модель воспроизводит механизм потери и утраты информации, то равновероятна утрата любого документа, описывающего какие-то события из (A, B). При гибели, например, архива, равновероятно уничтожение любого текста». [254]
254
Указ. соч. С. 109.
Из этого рассуждения можно уяснить — автор предполагает, что каждой точке множества Ш соответствует некоторая своя «виртуальная» хроника, и поскольку вероятность сохранения или утраты любой хроники одинакова, то и вероятность встречаемости каждой точки из Ш одинакова. Это было бы верно, но, к сожалению для автора, целые группы точек из множества Ш соответствуют всего одной «виртуальной» хронике.
Это напрямую связано с ничем не мотивированным предположением автора о существовании кратных максимумов и, соответственно, наличием наборов Xi с нулевыми координатами. Если «виртуальная» хроника имеет m различных максимумов (m <n– 1), то она допускает (с учетом того, что первое и последнее значения ряда — т.е. соответственно, расстояния от начала (конца) отрезка до первого (последнего) максимума — фиксированы) Сm– 1n– 2 = (n– 2)!/(m– 1)! (n-m– 1)! способов расстановки кратных максимумов, и следовательно, ровно столько точек из множества Ш, содержащих на месте кратных максимумов нулевые координаты, и соответствует этой хронике. Утрата этой «виртуальной» хроники (равновероятная среди других) немедленно влечет за собой утрату не одной, а всех Сm-1n-2 точек из множества Ш. Поэтому равномерность распределения случайного вектора по множеству Ш нарушается, а точки с нулевыми координатами имеют меньший статистический вес, чем остальные.
Легко оценить общее количество точек, в которых нарушена равномерность распределения. С помощью элементарной комбинаторики можно найти, что полное число точек в множестве Ш равно Cn-1A+n-1, а число точек в Ш, имеющих все координаты ненулевыми, — Cn-1A. Их отношение равно
Для наших модельных параметров A=450, n=15 получаем q=65%, а это значит, что для прочих (1-q) = 35% точек множества Ш, имеющих одну или несколько нулевых координат, равномерность распределения не выполняется.