Новая хронология Греции
Шрифт:
Поскольку параметр 3 — процентное содержание всех служебных слов — выделяется среди остальных параметров своей поразительной СТАБИЛЬНОСТЬЮ И РАЗЛИЧАЮЩЕЙ СПОСОБНОСТЬЮ, то интересно специально проследить за его колебаниями в зависимости от объема выборки. Приведем таблицу, показывающую зависимость величины отклонения от среднего значения при разных выборках. — Писатели! Процент! Величина отклонения этого параметра
! служебных! от его среднего значения при
! слов! следующих объемах выборок:
!!-
!! 2000! 4000! 8000! 16000 —ЧУЛКОВ…… …… 22,15……0,064….0,004……- …… НОВИКОВ …… 23,57……0,136….0,019……- …… ФОНВИЗИН …… …23,62……0,069….0,013….0,001……РАДИЩЕВ …… 22,30……0,054….0,018……- ……
Как видно из таблицы, стабилизация параметра 3 иногда наступает на объемах выборок, меньших чем 16000. Особенно это относится к писателям XVIII века. Например, для Карамзина стабилизация авторского инварианта наступает при объеме в 8000 слов, для Фонвизина — также 8000 слов. Вероятно, это указывает на несколько большую устойчивость стиля писателей XVIII века по сравнению с их коллегами в XIX и XX веках.
Подмеченное нами обстоятельство — ранняя стабилизация показывает, что в некоторых случаях авторским инвариантом (процент служебных слов) можно пользоваться и при изучении текстов небольших объемов. Однако при широких исследованиях необходимо все-таки пользоваться выборками в 16000 слов, поскольку только для них стабилизация параметра 3 наступает ОДНОВРЕМЕННО для всех исследованных авторов.
После обнаружения авторского инварианта для перечисленных 22 писателей, рамки эксперимента были расширены и аналогичные подсчеты были проведены еще для пяти авторов: А.Н.ОСТРОВСКОГО, А.К.ТОЛСТОГО, В.А.ЖУКОВСКОГО, А.С.ПУШКИНА и А.П.ЧЕХОВА. Были отобраны ПРОЗАИЧЕСКИЕ тексты БОЛЬШОГО объема. Расширенный эксперимент полностью подтвердил высокую стабильность параметра 3 при выборках в 16000 слов и его способность различать разные группы авторов. Таким образом, полный список писателей, для которых параметр 3 оказался устойчивым и различающим авторским инвариантом, расширился с 22 до 27.
10. КАК МОЖНО ПРИМЕНЯТЬ ОБНАРУЖЕННЫЙ АВТОРСКИЙ ИНВАРИАНТ?
Одно из возможных применений обнаруженного авторского инварианта — это распознавания плагиата, установления возможного авторства и т. п. Можно предложить следующую естественную методику. Если для двух исследуемых произведений значения параметра 3 (процент служебных слов) разнятся больше, чем на единицу, то есть основания заподозрить различное авторство сравниваемых текстов. Чем больше разница в значениях инварианта, тем подозрение серьезнее.
С другой стороны (как и в проблеме установления отцовства) близкие значения инварианта отнюдь не означают, что исследуемые произведения написаны одним автором. Как мы отмечали, встречаются разные писатели с близкими значениями инварианта. Например, Леонов и Фадеев, у которых эти числа равны соответственно 23,08 и 23,40.
Кроме того, применять методику распознавания авторов к текстам МАЛОГО объема следует чрезвычайно осторожно. Возникающие здесь трудности можно проиллюстрировать на примере крупных и мелких произведений А.П.Чехова. Параметр 3 (процент служебных слов) был просчитан вдоль всех его произведений в собрании сочинений 1960–1964 гг., Москва. Оказалось, что параметр 3 ведет себя следующим образом: —-
! мелкие рассказы! большие тексты —-номер тома! I! II! III! IV! V! VI! VII! VIII —-процент слу- 22,6 22,5 23,4 22,7 23,4 25,4 25,5 25,4 жебных слов —-
Разница между значениями параметра 3 для ранних МЕЛКИХ рассказов Чехова (I–V тома) и для более КРУПНЫХ повестей и рассказов позднего периода его творчества (VI–VIII тома) достаточно ощутима (рис. 8). Причем в ранних МЕЛКИХ рассказах не только МЕНЬШЕ служебных слов, но главное заключается в том, что разброс их больше, чем в последующих КРУПНЫХ произведениях. БОЛЬШИЕ (поздние) тексты Чехова характеризуются ВЫСОКОЙ СТАБИЛЬНОСТЬЮ авторского инварианта, как впрочем и для всех других 26 авторов БОЛЬШИХ текстов из нашего списка. В этом смысле Чехов не выделяется на их фоне — параметр 3 прекрасно "обслуживает" все его БОЛЬШИЕ сочинения.
В заключение отметим еще одно интересное обстоятельство. Оказалось, что процент служебных слов наиболее стабилен (при величине порций в 8000 и 16000 слов) на ПРОЗАИЧЕСКИХ произведениях и менее устойчив на ПОЭТИЧЕСКИХ текстах. Этот вопрос заслуживает отдельного рассмотрения и здесь мы не будем на нем останавливаться.
Обнаружение авторского инварианта в русском литературном языке делает весьма правдоподобным гипотезу о существовании аналогичных авторских инвариантов и в других языках. Они могут, конечно, отличаться от процента служебных слов. Особый интерес представляли бы авторские инварианты греческого и латыни, если иметь в виду применения аналогичных методик для распознавания авторства древних текстов.
11. СТАТИСТИЧЕСКИЙ АНАЛИЗ ТВОРЧЕСТВА ШОЛОХОВА
Внимательный читатель наверное уже отметил, что из исследованного нами списка 28 писателей почему-то один выпал. Это — Михаил Александрович Шолохов, к исследованию произведений которого мы сейчас и переходим. Все наши выводы мы основываем на анализе его сочинений, изданных в 8 томах в Москве в 1962 году.
Сразу же отметим, что мы ни в коей мере не претендуем на какие-либо окончательные выводы и публикуем полученные нами результаты в надежде, что они возможно окажутся полезными для исследователей творчества Шолохова.
Всем известно, что М.А.Шолохов достиг весьма видного положения в отечественной и мировой литературе. Нобелевская премия 1965 года также говорит о его международном признании.
Тем не менее, в течение нескольких десятков лет как у нас в стране, так и за рубежом, среди некоторой части специалистов высказываются сомнения относительно того, является ли М.А.Шолохов автором романа Тихий Дон или он написан казацким писателем Федором Дмитриевичем Крюковым (1870–1920), служившим в Донской белой армии и умершим от тифа в 1920 году.