Большая Советская Энциклопедия (СТ)
Шрифт:
Лит.: Карпенко Б. И., Финансовая статистика, М., 1929; Лившиц Ф. Д., Банковская статистика с основами общей теории, 2 изд., М., 1948; Ряузов Н. Н., Шор Ю. Л., Статистика в кредитных учреждениях, М., 1973; Статистика финансов, подред. П. П. Маслова, М., 1974.
В. М. Симчера.
Статистическая гипотеза
Статисти'ческаягипо'теза, предположительное суждение о вероятностных закономерностях, которым подчиняется изучаемое явление. Как правило, С. г. определяет значения параметров закона распределения вероятностей или его вид. С. г. называется простой, если она определяет единственный закон распределения; в ином случае С. г. называется сложной и может быть представлена как некоторый класс простых С. г. Например, гипотеза о том, что распределение вероятностей является нормальным
Статистическая лингвистика
Статисти'ческая лингви'стика, дисциплина, изучающая количественные закономерности естественного языка, проявляющиеся в текстах. В основе С. л. лежит предположение, что некоторые численные характеристики и функциональные зависимости между ними, полученные для ограниченной совокупности текстов, характеризуют язык в целом или его функциональные стили (публицистический, научный, художественный и т.п.). Практически важной и наиболее изученной числовой характеристикой является относительная частота употребления различных лингвистических единиц (букв, фонем, слогов, слов, синтаксических конструкций), их классов (например, гласных, согласных, частей речи) и сочетаний (например, последовательностей из n букв). Данные о частоте слов (иногда словосочетаний) отражаются в частотных словарях . Важную роль в С. л. играет функциональная зависимость, приближённо описывающая связь между частотой слова и его номером (рангом) в последовательности по убыванию частот — Ципфа — Мандельброта закон. С. л. изучает также зависимости между частотой и длиной слова (в числе слогов), числом его значений и возрастом. Накопленные данные используются для выявления особенностей стиля отдельных авторов, атрибуции текстов, дешифровки исторических письменностей, для решения задач стенографии, теории связи, а также информатики . С. л. при получении численных характеристик использует методы математической статистики и некоторые методы теории информации (для определения энтропии и избыточности языка, см. Информации теория ), а для установления связи между наблюдаемыми характеристиками и выбора наиболее существенных из них — метод математических моделей, базирующихся на понятиях теории вероятностей (см. Вероятностей теория ) и математической лингвистики . Возможно более широкое понимание С. л. как использования методов статистики для проверки лингвистических гипотез, которые могут носить и качественный характер.
Лит.: Головин Б. Н., Язык и статистика, М., 1971; Фрумкина Р. М., Статистические методы и стратегия лингвистического исследования, «Изв. АН СССР. Серия литературы и языка». 1975, т. 34, №2; Штейнфельдт Э. А., Частотный словарь современного русского языка, Таллин, 1963; Herdan G., The advanced theory of language as choice and chance, B.,1966; Mulier Ch., Initiation a la statistique linguistique, P., 1968.
М. В. Арапов.
Статистическая механика
Статисти'ческая меха'ника, тоже, что статистическая физика .
Статистическая проверка гипотез
Статисти'ческая прове'рка гипо'тез, система приёмов в математической статистике , предназначенных для проверки соответствия опытных данных некоторой статистической гипотезе . Процедуры С. п. г. позволяют принимать или отвергать статистические гипотезы, возникающие при обработке или интерпретации результатов измерений во многих практически важных разделах науки и производства, связанных с экспериментом. Правило, по которому принимается или отклоняется данная гипотеза, называется статистическим критерием. Построение критерия определяется выбором подходящей функции Т от результатов наблюдений, которая служит мерой расхождения между опытными и гипотетическими значениями. Эта функция, являющаяся случайной величиной, называется статистикой критерия, при этом предполагается, что распределение вероятностей Т может быть вычислено при допущении, что проверяемая гипотеза верна. По распределению статистики Т находится значение Т , такое, что если гипотеза верна, то вероятность неравенства T >T равна a, где a — заранее заданный значимости уровень . Если в конкретном случае обнаружится, что Т > T , то гипотеза отвергается, тогда как появление значения Т lb T не противоречит гипотезе. Пусть, например, требуется проверить гипотезу о том, что независимые результаты наблюдений x1 ,..., xn подчиняются нормальному распределению со средним значением а = a и известной дисперсией s2 . При этом предположении среднее арифметическое
и подчинена Стьюдента распределению с n — 1 степенями свободы (подобную задачу см. в ст. Математическая статистика , табл. 1a). Такого рода критерии называются критериями согласия и используются как для проверки гипотез о параметрах распределения, так и гипотез о самих распределениях (см. Непараметрические методы ). При решении вопроса о принятии или отклонении какой-либо гипотезы H