Вам необходимо вычислить дисперсию для следующих показателей. Дисперсия и стандартное отклонение в MS EXCEL

Теория вероятности - особый раздел математики, который изучают только студенты высших учебных заведений. Вы любите расчёты и формулы? Вас не пугают перспективы знакомства с нормальным распределением, энтропией ансамбля, математическим ожиданием и дисперсией дискретной случайной величины? Тогда этот предмет вам будет очень интересен. Давайте познакомимся с несколькими важнейшими базовыми понятиями этого раздела науки.

Вспомним основы

Даже если вы помните самые простые понятия теории вероятности, не пренебрегайте первыми абзацами статьи. Дело в том, что без четкого понимания основ вы не сможете работать с формулами, рассматриваемыми далее.

Итак, происходит некоторое случайное событие, некий эксперимент. В результате производимых действий мы можем получить несколько исходов - одни из них встречаются чаще, другие - реже. Вероятность события - это отношение количества реально полученных исходов одного типа к общему числу возможных. Только зная классическое определение данного понятия, вы сможете приступить к изучению математического ожидания и дисперсии непрерывных случайных величин.

Среднее арифметическое

Ещё в школе на уроках математики вы начинали работать со средним арифметическим. Это понятие широко используется в теории вероятности, и потому его нельзя обойти стороной. Главным для нас на данный момент является то, что мы столкнемся с ним в формулах математического ожидания и дисперсии случайной величины.

Мы имеем последовательность чисел и хотим найти среднее арифметическое. Всё, что от нас требуется - просуммировать всё имеющееся и разделить на количество элементов в последовательности. Пусть мы имеем числа от 1 до 9. Сумма элементов будет равна 45, и это значение мы разделим на 9. Ответ: - 5.

Дисперсия

Говоря научным языком, дисперсия - это средний квадрат отклонений полученных значений признака от среднего арифметического. Обозначается одна заглавной латинской буквой D. Что нужно, чтобы её рассчитать? Для каждого элемента последовательности посчитаем разность между имеющимся числом и средним арифметическим и возведем в квадрат. Значений получится ровно столько, сколько может быть исходов у рассматриваемого нами события. Далее мы суммируем всё полученное и делим на количество элементов в последовательности. Если у нас возможны пять исходов, то делим на пять.

У дисперсии есть и свойства, которые нужно запомнить, чтобы применять при решении задач. Например, при увеличении случайной величины в X раз, дисперсия увеличивается в X в квадрате раз (т. е. X*X). Она никогда не бывает меньше нуля и не зависит от сдвига значений на равное значение в большую или меньшую сторону. Кроме того, для независимых испытаний дисперсия суммы равна сумме дисперсий.

Теперь нам обязательно нужно рассмотреть примеры дисперсии дискретной случайной величины и математического ожидания.

Предположим, что мы провели 21 эксперимент и получили 7 различных исходов. Каждый из них мы наблюдали, соответственно, 1,2,2,3,4,4 и 5 раз. Чему будет равна дисперсия?

Сначала посчитаем среднее арифметическое: сумма элементов, разумеется, равна 21. Делим её на 7, получая 3. Теперь из каждого числа исходной последовательности вычтем 3, каждое значение возведем в квадрат, а результаты сложим вместе. Получится 12. Теперь нам остается разделить число на количество элементов, и, казалось бы, всё. Но есть загвоздка! Давайте её обсудим.

Зависимость от количества экспериментов

Оказывается, при расчёте дисперсии в знаменателе может стоять одно из двух чисел: либо N, либо N-1. Здесь N - это число проведенных экспериментов или число элементов в последовательности (что, по сути, одно и то же). От чего это зависит?

Если количество испытаний измеряется сотнями, то мы должны ставить в знаменатель N. Если единицами, то N-1. Границу ученые решили провести достаточно символически: на сегодняшний день она проходит по цифре 30. Если экспериментов мы провели менее 30, то делить сумму будем на N-1, а если более - то на N.

Задача

Давайте вернемся к нашему примеру решения задачи на дисперсию и математическое ожидание. Мы получили промежуточное число 12, которое нужно было разделить на N или N-1. Поскольку экспериментов мы провели 21, что меньше 30, выберем второй вариант. Итак, ответ: дисперсия равна 12 / 2 = 2.

Математическое ожидание

Перейдем ко второму понятию, которое мы обязательно должны рассмотреть данной статье. Математическое ожидание - это результат сложения всех возможных исходов, помноженных на соответствующие вероятности. Важно понимать, что полученное значение, как и результат расчёта дисперсии, получается всего один раз для целой задачи, сколько бы исходов в ней не рассматривалось.

Формула математического ожидания достаточно проста: берем исход, умножаем на его вероятность, прибавляем то же самое для второго, третьего результата и т. д. Всё, связанное с этим понятием, рассчитывается несложно. Например, сумма матожиданий равна матожиданию суммы. Для произведения актуально то же самое. Такие простые операции позволяет с собой выполнять далеко не каждая величина в теории вероятности. Давайте возьмем задачу и посчитаем значение сразу двух изученных нами понятий. Кроме того, мы отвлекались на теорию - пришло время попрактиковаться.

Ещё один пример

Мы провели 50 испытаний и получили 10 видов исходов - цифры от 0 до 9 - появляющихся в различном процентном отношении. Это, соответственно: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18%. Напомним, что для получения вероятностей требуется разделить значения в процентах на 100. Таким образом, получим 0,02; 0,1 и т.д. Представим для дисперсии случайной величины и математического ожидания пример решения задачи.

Среднее арифметическое рассчитаем по формуле, которую помним с младшей школы: 50/10 = 5.

Теперь переведем вероятности в количество исходов «в штуках», чтобы было удобнее считать. Получим 1, 5, 2, 7, 1, 9, 3, 8, 5 и 9. Из каждого полученного значения вычтем среднее арифметическое, после чего каждый из полученных результатов возведем в квадрат. Посмотрите, как это сделать, на примере первого элемента: 1 - 5 = (-4). Далее: (-4) * (-4) = 16. Для остальных значений проделайте эти операции самостоятельно. Если вы всё сделали правильно, то после сложения всех вы получите 90.

Продолжим расчёт дисперсии и математического ожидания, разделив 90 на N. Почему мы выбираем N, а не N-1? Правильно, потому что количество проведенных экспериментов превышает 30. Итак: 90/10 = 9. Дисперсию мы получили. Если у вас вышло другое число, не отчаивайтесь. Скорее всего, вы допустили банальную ошибку при расчётах. Перепроверьте написанное, и наверняка всё встанет на свои места.

Наконец, вспомним формулу математического ожидания. Не будем приводить всех расчётов, напишем лишь ответ, с которым вы сможете свериться, закончив все требуемые процедуры. Матожидание будет равно 5,48. Напомним лишь, как осуществлять операции, на примере первых элементов: 0*0,02 + 1*0,1… и так далее. Как видите, мы просто умножаем значение исхода на его вероятность.

Отклонение

Ещё одно понятие, тесно связанное с дисперсией и математическим ожиданием - среднее квадратичное отклонение. Обозначается оно либо латинскими буквами sd, либо греческой строчной «сигмой». Данное понятие показывает, насколько в среднем отклоняются значения от центрального признака. Чтобы найти её значение, требуется рассчитать квадратный корень из дисперсии.

Если вы построите график нормального распределения и захотите увидеть непосредственно на нём квадратичного отклонения, это можно сделать в несколько этапов. Возьмите половину изображения слева или справа от моды (центрального значения), проведите перпендикуляр к горизонтальной оси так, чтобы площади получившихся фигур были равны. Величина отрезка между серединой распределения и получившейся проекцией на горизонтальную ось и будет представлять собой среднее квадратичное отклонение.

Программное обеспечение

Как видно из описаний формул и представленных примеров, расчеты дисперсии и математического ожидания - не самая простая процедура с арифметической точки зрения. Чтобы не тратить время, имеет смысл воспользоваться программой, используемой в высших учебных заведениях - она называется «R». В ней есть функции, позволяющие рассчитывать значения для многих понятий из статистики и теории вероятности.

Например, вы задаете вектор значений. Делается это следующим образом: vector <-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

В заключение

Дисперсия и математическое ожидание - это без которых сложно в дальнейшем что-либо рассчитать. В основном курсе лекций в вузах они рассматриваются уже в первые месяцы изучения предмета. Именно из-за непонимания этих простейших понятий и неумения их рассчитать многие студенты сразу начинают отставать по программе и позже получают плохие отметки по результатам сессии, что лишает их стипендии.

Потренируйтесь хотя бы одну неделю по полчаса в день, решая задания, схожие с представленными в данной статье. Тогда на любой контрольной по теории вероятности вы справитесь с примерами без посторонних подсказок и шпаргалок.

Дисперсией (рассеянием) случайной величины называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:

Для вычисления дисперсии можно использовать слегка преобразованную формулу

так как М(Х) , 2 и
– постоянные величины. Таким образом,

4.2.2. Свойства дисперсии

Свойство 1. Дисперсия постоянной величины равна нулю. Действительно, по определению

Свойство 2. Постоянный множитель можно выносить за знак дисперсии с возведением его в квадрат.

Доказательство

Центрированной случайной величиной называется отклонение случайной величины от ее математического ожидания:

Центрированная величина обладает двумя удобными для преобразования свойствами:

Свойство 3. Если случайные величины Х иY независимы, то

Доказательство . Обозначим
. Тогдаи.

Во втором слагаемом в силу независимости случайных величин и свойств центрированных случайных величин

Пример 4.5. Еслиa иb – постоянные, тоD(a Х+ b )= D (a Х)+ D (b )=
.

4.2.3. Среднее квадратическое отклонение

Дисперсия, как характеристика разброса случайной величины, имеет один недостаток. Если, например, Х – ошибка измерения имеет размерность ММ , то дисперсия имеет размерность
. Поэтому часто предпочитают пользоваться другой характеристикой разброса –средним квадратическим отклонением , которое равно корню квадратному из дисперсии

Среднее квадратическое отклонение имеет ту же размерность, что и сама случайная величина.

Пример 4.6. Дисперсия числа появления события в схеме независимых испытаний

Производится n независимых испытаний и вероятность появления события в каждом испытании равнар . Выразим, как и прежде, число появления событияХ через число появления события в отдельных опытах:

Так как опыты независимы, то и связанные с опытами случайные величины независимы. А в силу независимостиимеем

Но каждая из случайных величин имеет закон распределения (пример 3.2)

и
(пример 4.4). Поэтому, по определению дисперсии:

где q =1- p .

В итоге имеем
,

Среднее квадратическое отклонение числа появлений события в n независимых опытах равно
.

4.3. Моменты случайных величин

Помимо уже рассмотренных случайные величины имеют множество других числовых характеристик.

Начальным моментом k Х (
) называется математическое ожиданиеk -й степени этой случайной величины.

Центральным моментом k -го порядка случайной величиныХ называется математическое ожиданиеk -ой степени соответствующей центрированной величины.

Легко видеть, что центральный момент первого порядка всегда равен нулю, центральный момент второго порядка равен дисперсии, так как .

Центральный момент третьего порядка дает представление об асимметрии распределения случайной величины. Моменты порядка выше второго употребляются сравнительно редко, поэтому мы ограничимся только самими понятиями о них.

4.4. Примеры нахождения законов распределения

Рассмотрим примеры нахождения законов распределения случайных величин и их числовых характеристик.

Пример 4.7.

Составить закон распределения числа попаданий в цель при трех выстрелах по мишени, если вероятность попадания при каждом выстреле равна 0,4. Найти интегральную функцию F (х) для полученного распределения дискретной случайной величиныХ и начертить ее график. Найти математическое ожиданиеM (X ) , дисперсиюD (X ) и среднее квадратическое отклонение
(Х ) случайной величиныX .

Решение

1) Дискретная случайная величина Х – число попаданий в цель при трех выстрелах – может принимать четыре значения:0, 1, 2, 3 . Вероятность того, что она примет каждое из них, найдем по формуле Бернулли при:n =3,p =0,4,q =1- p =0,6 иm =0, 1, 2, 3:

Получим вероятности возможных значений Х :;

Составим искомый закон распределения случайной величины Х :

Контроль: 0,216+0,432+0,288+0,064=1.

Построим многоугольник распределения полученной случайной величины Х . Для этого в прямоугольной системе координат отметим точки (0; 0,216), (1; 0,432), (2; 0,288), (3; 0,064). Соединим эти точки отрезками прямых, полученная ломаная и есть искомый многоугольник распределения (рис. 4.1).

2) Если х0, то F (х) =0. Действительно, значений, меньших нуля, величина Х не принимает. Следовательно, при всех х 0 , пользуясь определениемF (х) , получим F (х) =P (X < x ) =0 (как вероятность невозможного события).

Если 0, тоF (X ) =0,216. Действительно, в этом случаеF (х) =P (X < x ) = =P (- < X0)+ P (0< X < x ) =0,216+0=0,216.

Если взять, например, х =0,2, тоF (0,2)=P (X <0,2) . Но вероятность событияХ <0,2 равна 0,216, так как случайная величинаХ лишь в одном случае принимает значение меньшее 0,2, а именно0 с вероятностью 0,216.

Если 1, то

Действительно, Х может принять значение 0 с вероятностью 0,216 и значение 1 с вероятностью 0,432; следовательно, одно из этих значений, безразлично какое,Х может принять (по теореме сложения вероятностей несовместных событий) с вероятностью 0,648.

Если 2, то рассуждая аналогично, получимF (х) =0,216+0,432 + + 0,288=0,936. Действительно, пусть, например,х =3. ТогдаF (3)=P (X <3) выражает вероятность событияX <3 – стрелок сделает меньше трех попаданий, т.е. ноль, один или два. Применяя теорему сложения вероятностей, получим указанное значение функцииF (х) .

Если x >3, тоF (х) =0,216+0,432+0,288+0,064=1. Действительно, событиеX
является достоверным и вероятность его равна единице, аX >3 – невозможным. Учитывая, что

F (х) =P (X < x ) =P (X3) + P (3< X < x ) , получим указанный результат.

Итак, получена искомая интегральная функция распределения случайной величины Х:

F (x ) =

график которой изображен на рис. 4.2.

3) Математическое ожидание дискретной случайной величины равно сумме произведений всех возможных значений Х на их вероятности:

М(Х) =0=1,2.

То есть, в среднем происходит одно попадание в цель при трех выстрелах.

Дисперсию можно вычислить, исходя из определения дисперсии D (X )= M (X - M (X )) или воспользоваться формулойD (X )= M (X
, которая ведет к цели быстрее.

Напишем закон распределения случайной величины Х:

Найдем математическое ожидание для Х :

М(Х) = 04
= 2,16.

Вычислим искомую дисперсию:

D (X ) = M (X) – (M (X )) = 2,16 – (1,2)= 0,72.

Среднее квадратическое отклонение найдем по формуле

(X ) =
= 0,848.

Интервал (M - ; M + ) = (1,2-0,85; 1,2+0,85) = (0,35; 2,05) – интервал наиболее вероятных значений случайной величиныХ , в него попадают значения 1 и 2.

Пример 4.8.

Дана дифференциальная функция распределения (функция плотности) непрерывной случайной величины Х :

f (x ) =

1) Определить постоянный параметр a .

2) Найти интегральную функцию F (x ) .

3) Построить графики функций f (x ) иF (x ) .

4) Найти двумя способами вероятности Р(0,5< X1,5) иP (1,5< X <3,5) .

5). Найти математическое ожидание М(Х) , дисперсиюD (Х) и среднее квадратическое отклонение
случайной величиныХ .

Решение

1) Дифференциальная функция по свойству f (x ) должна удовлетворять условию
.

Вычислим этот несобственный интеграл для данной функции f (x ) :

Подставляя этот результат в левую часть равенства, получим, что а =1. В условии дляf (x ) заменим параметра на 1:

2) Для нахождения F (x ) воспользуемся формулой

.

Если х
, то
, следовательно,

Если 1
то

Если x>2, то

Итак, искомая интегральная функция F (x ) имеет вид:

3) Построим графики функций f (x ) иF (x ) (рис. 4.3 и 4.4).

4) Вероятность попадания случайной величины в заданный интервал (а, b ) вычисляется по формуле
, если известнафункция f (x ), и по формуле P (a < X < b ) = F (b ) – F (a ), если известна функция F (x ).

Найдем
по двум формулам и сравним результаты. По условиюа=0,5; b =1,5; функцияf (X ) задана в пункте 1). Следовательно, искомая вероятность по формуле равна:

Та же вероятность может быть вычислена по формуле b) через приращение полученной в п.2). интегральной функцииF (x ) на этом интервале:

Так какF (0,5)=0.

Аналогично находим

так как F (3,5)=1.

5) Для нахождения математического ожидания М(Х) воспользуемся формулой
Функцияf (x ) задана в решении пункта 1), она равна нулю вне интервала (1,2]:

Дисперсия непрерывной случайной величиныD (Х) определяется равенством

, или равносильным равенством


.

ДлянахожденияD (X ) воспользуемся последней формулой и учтем, что все возможные значенияf (x ) принадлежат интервалу (1,2]:

Среднее квадратическое отклонение
=
=0,276.

Интервал наиболее вероятных значений случайной величины Х равен

(М-
,М+
) = (1,58-0,28; 1,58+0,28) = (1,3; 1,86).

Во многих случаях возникает необходимость ввести ещё одну числовую характеристику для измерения степени рассеивания, разброса значений , принимаемых случайной величиной ξ , вокруг её математического ожидания.

Определение. Дисперсией случайной величины ξ называется число.

D ξ = M(ξ-M ξ) 2 . (1)

Другими словами, дисперсия есть математическое ожидание квадрата отклонения значений случайной величины от её среднего значения.

называется средним квадратичным отклонением

величины ξ .

Если дисперсия характеризует средний размер квадрата отклонения ξ , то число можно рассматривать как некоторую среднюю характеристику самого отклонения, точнее, величины | ξ-Mξ |.

Из определения (1) вытекают следующие два свойства дисперсии.

1. Дисперсия постоянной величины равна нулю. Это вполне соответствует наглядному смыслу дисперсии, как «меры разброса».

Действительно, если

ξ = С, то Mξ = C и, значит Dξ = M(C-C ) 2 = M 0 = 0.

2. При умножении случайной величины ξ на постоянное число С её дисперсия умножается на C 2

D(Cξ ) = C 2 . (3)

Действительно

D(Cξ) = M(C

= M(C .

3. Имеет место, следующая формула для вычисления дисперсии:

. (4)

Доказательство этой формулы следует из свойств математического ожидания.

Мы имеем:

4. Если величины ξ 1 и ξ 2 независимы, то дисперсия их суммы равна сумме их дисперсий:

Доказательство . Для доказательства используем свойства математического ожидания. Пусть 1 = m 1 , 2 = m 2 , тогда.

Формула (5) доказана.

Так как дисперсия случайной величины есть по определению математическое ожидание величины (ξ -m ) 2 , где m = Mξ , то для вычисления дисперсии можно воспользоваться формулами, полученными в §7 гл.II.

Так, если ξ есть ДСВ с законом распределения

x 1 x 2 ...
p 1 p 2 ...

то будем иметь:

. (7)

Если ξ непрерывна случайная величина с плотностью распределения p(x) , тогда получим:

= . (8)

Если использовать формулу (4) для вычисления дисперсии, то можно получить другие формулы, а именно:

, (9)

если величина ξ дискретна, и

= , (10)

если ξ распределена с плотностью p (x ).

Пример 1 . Пусть величина ξ равномерно распределена на отрезке [a,b ]. Воспользовавшись формулой (10) получим:

Можно показать, что дисперсия случайной величины , распределенной по нормальному закону с плотностью

p(x) = , (11)

равна σ 2 .

Тем самым выясняется смысл параметра σ, входящего в выражение плотности (11) для нормального закона; σ ecть среднее квадратичное отклонение величины ξ .

Пример 2 . Найти дисперсию случайной величины ξ , распределенной по биномиальному закону.


Решение . Воспользовавшись представлением ξ в виде

ξ = ξ 1 + ξ 2 + ξ n (см. пример 2 §7 гл. II) и применяя формулу сложения дисперсий для независимых величин, получим

Dξ = Dξ 1 + Dξ 2 + Dξ n .

Дисперсия любой из величин ξ i (i = 1,2, n ) подсчитывается непосредственно:

Dξ i = M(ξ i ) 2 - (Mξ i ) 2 = 0 2 · q + 1 2 p - p 2 = p (1-p ) = pq .

Окончательно получаем

= npq , где q = 1 - p .

Дисперсия в статистике находится как индивидуальных значений признака в квадрате от . В зависимости от исходных данных она определяется по формулам простой и взвешенной дисперсий:

1. (для несгруппированных данных) вычисляется по формуле:

2. Взвешенная дисперсия (для вариационного ряда):

где n — частота (повторяемость фактора Х)

Пример нахождения дисперсии

На данной странице описан стандартный пример нахождения дисперсии, также Вы можете посмотреть другие задачи на её нахождение

Пример 1. Имеются следующие данные по группе из 20 студентов заочного отделения. Нужно построить интервальный ряд распределения признака, рассчитать среднее значение признака и изучить его дисперсию

Построим интервальную группировку. Определим размах интервала по формуле:

где X max– максимальное значение группировочного признака;
X min–минимальное значение группировочного признака;
n – количество интервалов:

Принимаем n=5. Шаг равен: h = (192 — 159)/ 5 = 6,6

Составим интервальную группировку

Для дальнейших расчетов построим вспомогательную таблицу:

X’i– середина интервала. (например середина интервала 159 – 165,6 = 162,3)

Среднюю величину роста студентов определим по формуле средней арифметической взвешенной:

Определим дисперсию по формуле:

Формулу дисперсии можно преобразовать так:

Из этой формулы следует, что дисперсия равна разности средней из квадратов вариантов и квадрата и средней.

Дисперсия в вариационных рядах с равными интервалами по способу моментов может быть рассчитана следующим способом при использовании второго свойства дисперсии (разделив все варианты на величину интервала). Определении дисперсии , вычисленной по способу моментов, по следующей формуле менее трудоемок:

где i - величина интервала;
А - условный ноль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой;
m1 — квадрат момента первого порядка;
m2 — момент второго порядка

(если в статистической совокупности признак изменяется так, что имеются только два взаимно исключающих друг друга варианта, то такая изменчивость называется альтернативной) может быть вычислена по формуле:

Подставляя в данную формулу дисперсии q =1- р, получаем:

Виды дисперсии

Общая дисперсия измеряет вариацию признака по всей совокупности в целом под влиянием всех факторов, обуславливающих эту вариацию. Она равняется среднему квадрату отклонений отдельных значений признака х от общего среднего значения х и может быть определена как простая дисперсия или взвешенная дисперсия.

характеризует случайную вариацию, т.е. часть вариации, которая обусловлена влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Такая дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы X от средней арифметической группы и может быть вычислена как простая дисперсия или как взвешенная дисперсия.

Таким образом, внутригрупповая дисперсия измеряет вариацию признака внутри группы и определяется по формуле:

где хi - групповая средняя;
ni - число единиц в группе.

Например, внутригрупповые дисперсии, которые надо определить в задаче изучения влияния квалификации рабочих на уровень производительности труда в цехе показывают вариации выработки в каждой группе, вызванные всеми возможными факторами (техническое состояние оборудования, обеспеченность инструментами и материалами, возраст рабочих, интенсивность труда и т.д.), кроме отличий в квалификационном разряде (внутри группы все рабочие имеют одну и ту же квалификацию).

Средняя из внутри групповых дисперсий отражает случайную , т. е. ту часть вариации, которая происходила под влиянием всех прочих факторов, за исключением фактора группировки. Она рассчитывается по формуле:

Характеризует систематическую вариацию результативного признака, которая обусловлена влиянием признака-фактора, положенного в основание группировки. Она равняется среднему квадрату отклонений групповых средних от общей средней. Межгрупповая дисперсия рассчитывается по формуле:

Правило сложения дисперсии в статистике

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповых дисперсий:

Смысл этого правила заключается в том, что общая дисперсия, которая возникает под влиянием всех факторов, равняется сумме дисперсий, которые возникают под влиянием всех прочих факторов, и дисперсии, возникающей за счет фактора группировки.

Пользуясь формулой сложения дисперсий, можно определить по двум известным дисперсиям третью неизвестную, а также судить о силе влияния группировочного признака.

Свойства дисперсии

1. Если все значения признака уменьшить (увеличить) на одну и ту же постоянную величину, то дисперсия от этого не изменится.
2. Если все значения признака уменьшить (увеличить) в одно и то же число раз n, то дисперсия соответственно уменьшится (увеличить) в n^2 раз.

Для сгруппированных данных остаточная дисперсия - средняя из внутригрупповых дисперсий:

Где σ 2 j - внутригрупповая дисперсия j -й группы.

Для не сгруппированных данных остаточная дисперсия – мера точности аппроксимации, т.е. приближения линии регрессии к исходным данным:
где y(t) – прогноз по уравнению тренда; y t – исходный ряд динамики; n – количество точек; p – число коэффициентов уравнения регрессии (количество объясняющих переменных).
В этом примере она называется несмещенная оценка дисперсии .

Пример №1 . Распределение рабочих трех предприятий одного объединения по тарифным разрядам характеризуется следующими данными:

Тарифный разряд рабочего Численность рабочих на предприятии
предприятие 1 предприятие 2 предприятие 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Определить:
1. дисперсию по каждому предприятию (внутригрупповые дисперсии);
2. среднюю из внутригрупповых дисперсий;
3. межгрупповую дисперсию ;
4. общую дисперсию.

Решение.
Прежде чем приступить к решению задачи необходимо выяснить, какой признак является результативным, а какой – факторным. В рассматриваемом примере результативным признаком является «Тарифный разряд», а факторным признаком – «Номер (название) предприятия».
Тогда имеем три группы (предприятия), для которых необходимо рассчитать групповую среднюю и внутригрупповые дисперсии :


Предприятие Групповая средняя, Внутригрупповая дисперсия,
1 4 1,8

Средняя из внутригрупповых дисперсий (остаточная дисперсия ) рассчитаем по формуле:


где можно рассчитать:
либо:


тогда:
Общая дисперсия будет равна: s 2 = 1,6 + 0 = 1,6.
Общую дисперсию также можно рассчитать и по одной из следующих двух формул:

При решении практических задач часто приходится иметь дело с признаком, принимающим только два альтернативных значения. В этом случае говорят не о весе того или иного значения признака, а о его доле в совокупности. Если долю единиц совокупности, обладающих изучаемым признаком, обозначить через «р », а не обладающих – через «q », то дисперсию можно рассчитать по формуле:
s 2 = p×q

Пример №2 . По данным о выработке шести рабочих бригады определить межгрупповую дисперсию и оценить влияние рабочей смены на их производительность труда, если общая дисперсия равна 12,2 .

№ рабочего бригады Выработка рабочего, шт.
в I смену во II смену
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Решение . Исходные данные

X f 1 f 2 f 3 f 4 f 5 f 6 Итого
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Итого 31 33 37 37 40 38

Тогда имеем 6 группы, для которых необходимо рассчитать групповую среднюю и внутригрупповые дисперсии.
1. Находим средние значения каждой группы .







2. Находим среднее квадратическое каждой группы .







Результаты расчета сведем в таблицу:
Номер группы Групповая средняя Внутригрупповая дисперсия
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Внутригрупповая дисперсия характеризует изменение (вариацию) изучаемого (результативного) признака в пределах группы под действием на него всех факторов, кроме фактора, положенного в основание группировки:
Среднюю из внутригрупповых дисперсий рассчитаем по формуле:


4. Межгрупповая дисперсия характеризует изменение (вариацию) изучаемого (результативного) признака под действием на него фактора (факторного признака), положенного в основание группировки.
Межгрупповую дисперсию определим как:

где


Тогда

Общая дисперсия характеризует изменение (вариацию) изучаемого (результативного) признака под действием на него всех без исключения факторов (факторных признаков). По условию задачи она равна 12.2 .
Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Это отношение факторной дисперсии к общей дисперсии:

Определяем эмпирическое корреляционное отношение:

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 0.3 0.5 0.7 0.9 В нашем примере связь между признаком Y фактором X слабая
Коэффициент детерминации.

Определим коэффициент детерминации:

Таким образом, на 0.67% вариация обусловлена различиями между признаками, а на 99.37% – другими факторами.
Вывод : в данном случае выработка рабочих не зависит от работы в конкретную смену, т..е. влияние рабочей смены на их производительность труда не значительное и обусловлено другими факторами.

Пример №3 . На основе данных о средней заработной плате и квадратах отклонений от её величины по двум группам рабочих найти общую дисперсию, применив правило сложения дисперсий:

Решение:
Средняя из внутригрупповых дисперсий

Межгрупповую дисперсию определим как:


Общая дисперсия будет равна: 480 + 13824 = 14304