Очень общая метрология
Шрифт:
В принципе возможно симметричное распределение, при котором средняя величина не приближается к истинному значению, хотя такое распределение не имеет ничего общего с нормальным и вряд ли может встретиться на практике. Заметим, что при симметричном бимодальном распределении оценка средним состоятельна. При нормальном распределении состоятельна также и оценка дисперсии.
Несмещенность означает отсутствие систематических отклонений оценки от параметра при любом конечном, в том числе и малом, объеме выборки. Использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приводит к систематическим ошибкам, поскольку реальная выборка всегда конечна. При нормальном распределении оценка истинного значения средним является несмещенным, а оценка дисперсии по обычной формуле (сумма квадратов отклонений от среднего, деленная на число измерений) нет: при одном измерении она дает очевидную глупость —
Эффективность оценки означает, что если извлекать из генеральной совокупности разные серии наблюдений, то полученные из них оценки какого-то параметра будут иметь минимальную дисперсию по сравнению с другими методами оценки.
В обычной ситуации часто имеет место распределение, близкое к нормальному. Иногда рассматривают другие распределения — равномерное, арксинусное, треугольное и другие, которые разумно сочетают соответствие реальности и удобство вычислений. Отклонения от нормального распределения, хоть большие, хоть вовсе неунимодальность, воспринимаются физиком как «Пионерская зорька» — то есть как указание на действие какого-то механизма, который можно попытаться определить. В частности неунимодальность может быть следствием неустойчивости, а может быть результатом смешения двух распределений.
Функция распределения определяется тем точнее, чем большим количеством измерений мы располагаем. Но чем больше измерений — тем дороже процедура и вообще, длительные измерения это не очень хорошо — сам объект может измениться (хотя растет шанс это заметить!), да и потребность в результате обычно связана с временем получения оного. Поэтому «все прогрессивное человечество» день и ночь размышляет, как по небольшому количеству измерений определить функцию распределения. Существует несколько способов оценить, удовлетворяет ли полученный набор данных той или иной функции распределения, есть несколько так называемых «критериев согласия»: хи-квадрат (Пирсона), Колмогорова, моментов. Само наличие нескольких критериев согласия говорит о гуманитарности всех таких оценок. Практическое же применение в значительной степени опирается на опыт, практику в конкретной области, «чутье».
Любой прибор имеет диапазон измерений, и на практику случаются (чаще в социологии) ситуации, когда диапазон охватывает только основную область измерений. В социологии крайние выборы на шкале бывают сформулированы не в виде диапазона, а в виде одностороннего ограничения. Например, «ваш доход за прошлый месяц — до 100, 101–300, 301-1000, 1001–3000, более 3001». В этом-то случае количества выбравших тот или иной ответ — это просто интегралы по соответствующим диапазонам, но вот более сложный случай. Пусть мы проводим экзамен и вот количества решивших то или иное количество задач: 0 задач — 10, 1, 2, 6 и 7 задачи — по 1, 3 и 5 задач — по 3, 4 задачи — 10, 8 задач — 0. Означает ли это, что у нас бимодальное распределение с медианами 0 и 5? Нет, это означает, что трудности задач были таковы, что именно эти количества респондентов рашали именно эти количества задач. Определение набора оптимальных по трудности задач, исходя из априорной (скорее всего — нормальной) функции распределения и конкретных требованиях по отбору (обычно — разбиение на группы, часто на две) — нерешенная задача. Скорее всего, решить ее в такой постановке и невозможно, ибо понятие трудности задачи не универсально: задача описывается не одним параметром.
В реальной ситуации могут встретиться и неунимодальное распределение, поскольку как в медицине, так и в технике случаются фиксированные «поломки», формирующие свою функцию распределения, скорее всего — нормальную, но с другим средним значением.
При проведении измерений иногда случаются грубые ошибки, вызванные неправильными действиями оператора, так называемые «промахи». Например, отсчет азимута с ошибкой 180° при топографической съемке в спелеологии, отсчет с «не той» шкалы в многопредельных приборах. При проведении практических измерений такие ошибки обычно замечаются сразу — на основе предшествующих измерений или исходной информации — и сразу же и отбрасываются. Цивилизованная же процедура исключения промахов такова: сначала вычисляется среднеквадратичное отклонение ц (в предположении, что распределение нормальное!), а потом отбрасываются все измерения, отклоняющиеся от среднего больше, чем на 3ц. Оснований для таких действий два: «промахи» относительно слабо влияют на среднее и дисперсию и, скажем при 20-и измерениях для нормального распределения выход результата за указанные границы происходит с вероятностью 0,01.
Когда после обработки результатов измерений мы указываем для искомой величины одно значение, это называется «точечная оценка». Часто этим нельзя ограничиться, а нужно еще указать и вероятность, с которой искомая величина находится в тех или иных пределах, так называемые
На практике часто искомая величина вычисляется по результатам измерения нескольких величин, то есть осуществляются косвенные измерения. В этом случае, согласно школьному курсу физики, если величины складываются или вычитаются, то абсолютные погрешности складываются, а если перемножаются или делятся, то складываются относительные погрешности. Если же производятся прямые многократные измерения одной и той же величины, то появляется возможность уменьшения относительной погрешности. А именно, относительная погрешность убывает пропорционально корню из количества измерений, то есть усреднение скажем 10 измерений уменьшает случайную погрешность в 3 раза. При наличии серий измерений, имеющих разную точность, измерения, имеющие меньшую дисперсию, следует учитывать с большими весами. Хотя на практике скорее попытаются увеличить количество измерений, выполненных с меньшей дисперсией.
Существенная часть измерений выполняет в цивилизации функцию контроля. Это означает, что результат обработки данных такого измерения должен быть бинарен: годен — или нет, свой — или чужой, любит — или не любит. В этом случае полная схема возможных ситуаций это четыре варианта: принятие годного, отклонение негодного, пропуск негодного — «пропуск атаки» и отклонение годного — «ложная тревога». Обычно в системе есть управляемый параметр, чувствительность, от которого и зависит ее поведение. При малой чувствительности нет ложных тревог, но есть пропуски атаки. При высокой чувствительности все наоборот, и пьяная ворона легко канает за МБР, а стая — даже за разделяющиеся головные части. Оптимальная чувствительность зависит от цены той и другой ошибки, реальной ситуации — частоты ложных тревог и от нашей гипотезы относительно частоты атак. Как мы видим, и здесь играет роль исходная гипотеза.
Конкретные измерения
Электрические измерения: напряжение, ток, сопротивление, мощность
Измерять в быту электрические параметры приходится не часто, а некоторым — и никогда.
Напряжение в сети либо есть, либо его нет, и определяют это просто подключив нагрузку — проще всего настольную лампу. Разумеется, если вы живете в «умном доме» или «на Рублевке», то можете позволить себе быть идиотом, не умеющим пользоваться тестером, но если вы воспользовались разрешением, то зачем вам эта книга? Кстати, насчет тестера: две распространенные ошибки — держаться при измерении прямо за металлические части щупов и совать в сеть прибор, оставленный кем-то в положении «измерение сопротивлений». Следствия очевидны, вторую из ошибок автор когда-то разок сделал.
Напряжение аккумуляторов и батареек определять приходится, потому что люди часто хранят полуизрасходованные батарейки вместе с новыми. Однако в этом случае ситуация чуть сложнее, чем с сетью. И не потому, что она редко бывает полуизрасходованной. Дело в том, что любой источник питания имеет внутреннее сопротивление, и если оно возросло, то даже при нормальном напряжении на холостом ходу источник может не потянуть большую нагрузку. Поэтому проверять напряжение лучше под нагрузкой, причем близкой к той, с которой предполагается работать. Знатокам закона Ома предлагаем задачу: две батарейки с равными и нормальными ЭДС, но одна из них с сильно увеличенным внутренним сопротивлением, соединены последовательно и нагружены на лампочку. Что покажет подключенный к ним поочередно вольтметр? Получите ответ и представьте себе ощущения автора, когда он увидел это в реале.
Ток в быту определять практически никогда не приходится, разве что потребление гаджетов для оценки, на сколько хватит аккумулятора или батарейки. Делается это тем же самым тестером, но при другом положении переключателей. Бытовые нагрузки таковы, что влиянием сопротивления прибора на измерения во всех перечисленных случаях можно пренебречь. Роль сопротивления контактов и утечек при измерении в бытовых ситуациях также не велика.
Сопротивление в быту измерять приходится редко, чаще делать нечто подобное — определять целостность нагрузки или целостность изоляции. Потому что многие бытовые приборы выходят из строя путем разрыва цепи питания или перегорания обмотки, а некоторые — путем выхода из строя (пробоя) изоляции. Для этого примеряется тестер, но если вы проверяете целостность обмоток трансформатора, дросселя или электродвигателя, то школьный курс физики настоятельно рекомендует не держаться за оголенные контакты. Хотя напряжение батарейки в тестере не бывает больше 9 вольт, вы именете шансы познакомиться со страшным зверем по имени «экстратоки размыкания». И хотя правильнее было бы назвать это явление экстранапряжением, но вам от этого легче не будет.