История и антиистория. Критика «новой хронологии» академика А.Т. Фоменко
Шрифт:
Итак, и коэффициент линейной корреляции, и коэффициент регрессии отвергают возможность существования связи (1) для данных рядов X и Y. Тем не менее удивительным будет узнать, что коэффициент Л(X, Y) определяет эти ряды как зависимые друг от друга, с вероятностью случайного совпадения не более 2 шансов на миллион (Л(X, Y) <2x10– 6).
Расскажем подробнее, как получается эта оценка. Для n, много больших единицы при вычислении Л(X, Y) автор
Здесь Vn-1(Ш') — (n– 1)-мерный объем множества Ш', которое состоит уже не только из целочисленных, но из всех n– мерных точек с неотрицательными координатами, удовлетворяющих условию (4), а Vn-1(X, ) — (n– 1)-мерный объем той части Ш', точки которой лежат ближе к точке X, чем расстояние r до точки Y, вычисленное согласно (3). Из элементарных геометрических формул легко найти, что,
Величина же Vn-1(X, ) равна объему некоторой части (n– 1)-мерного шара с центром в точке X и радиусом (весь этот шар лежит в (n– 1)-мерной гиперплоскости, заданной условием (4), но может содержать точки с отрицательными координатами, поэтому в множество Ш' входит только часть шара). Ясно, что Vn-1(X, ) не может превосходить полного объема (n– 1)-мерного шара радиуса , который легко вычисляется, и таким образом имеем (для нечетных n, как в нашем примере) [251]
251
Ср. Фоменко А. Т. Некоторые статистические закономерности распределения плотности информации в текстах со шкалой // Семиотика и информатика. М., 1980. Вып. 15. С. 107.
Подставляя эту оценку в формулу (5) мы получим искомую границу сверху на значение Л(X, Y).
Неравенство (8) переходит в равенство, если шар Vn-1(X, ) целиком лежит в множестве Ш. Когда это же выполнено и для Vn-1(Y, ), то мера коммутативна и
Оценка (8) играет большую роль для понимания смысла и значимости коэффициента Л(X, Y).
1) Она объясняет происхождение «малых чисел», которые постоянно встречаются в работах Фоменко, и якобы, гарантируют его результатам абсолютную достоверность. Дело в том, что в (8) отношение /A, будучи числом меньшим единицы, возводится в большую степень (n– 1) и соответственно, по известному математическому свойству, становится очень малым. Так, в нашем примере, =33.3 года, /A= 0,074, но после возведения в 14 степень верхняя граница коэффициента Л(X, Y) оказывается равной = 2x10– 6.
2) Обнаруживается «сверхчувствительность» коэффициента к изменениям положения максимумов. Например, если расстояние — изменится на один год, то пользуясь формулой (8') для коммутативных коэффициентов, можно оценить относительное изменение коэффициента Л(X, Y)
Полагая в нашем примере = 1 год, = 33 года, получим, что значение коэффициента изменится на 43%, т.е. почти наполовину. Впечатляют оценки и для больших изменений: если расстояние изменить на 50% (уменьшить вполовину), то уменьшится в 214, т.е. более чем в 16 тысяч раз! Эти изменения совершенно не сопоставимы к обычной чувствительностью статистических коэффициентов (например, чувствительность коэффициента корреляции просто линейно связана с изменениями начальных данных).
Значение Л(X, Y) имеет высокую чувствительность и к числу n (т.е. к изменениям числа максимумов и соответствующего количества членов ряда Xi или Yi), Для обычных статистических коэффициентов (см. (2')) значимость обратно пропорциональна n, и, если n много больше единицы, то при небольшом его изменении оценки значимости коэффициентов корреляции или регрессии практически не изменятся. В то же время, скажем, если в нашем примере мы произвольно выделим еще по 2 новых максимума в каждой из "хроник" X и Y (т.е. изменим n с 15 до 17), то расстояние при этом изменится не слишком значительно, зато уровень коэффициента Л(X, Y) упадет в 2 раза. Из (8') для коммутативных коэффициентов следует:
Таким образом, падение будет тем больше, чем меньше «расстояние» между X и Y, так, например, для = 15 лет при том же изменении n уровень коэффициента Л(X, Y) упадет уже в 10 раз. Следовательно, при сопоставлении разных пар хроник с разным числом локальных максимумов значения коэффициентов Л(X, Y) несопоставимы друг с другом, поскольку каждый раз уровень значимости коэффициента должен определяться отдельно, в зависимости от числа n. В указанной книге А. Т. Фоменко такой анализ отсутствует.
Итак, чувствительность коэффициента Л(X, Y) служит существенной проблемой и обостряет проблему интерпретации результата, в то же время обычные статистические коэффициенты полностью лишены этого недостатка.
3) Разберем теперь некоторые конкретные значения коэффициента. Предположим, что в двух хрониках соответствующие промежутки между максимумами отличаются не более чем на лет, т.е. для любого номера i
Если считать, что хроники описывают одинаковые события, то величина имеет смысл наибольшей ошибки хрониста при определении промежутка между последовательными событиями (максимумами). Подставляя неравенства (9) в расстояние (3), получаем, что <= n, что в свою очередь позволяет подставить это расстояние в неравенство (8). Окончательно, мы получаем зависимость , график которой в логарифмическом масштабе изображен на рисунке (здесь по-прежнему, A=450, n=15; по вертикальной оси отложен десятичный логарифм от ).