Реферат: Анализ рядов распределения

--PAGE_BREAK--1.2 Медиана


Медианой Ме называют такое значение признака, которое приходится на середину ранжированного ряда и делит его на две равные по числу единиц части. Таким образом, в ранжированном ряду распределения одна половина ряда имеет значения признака, превышающие медиану, другая — меньше медианы. Медиану используют вместо средней арифметической, когда крайние варианты ранжированного ряда (наименьшая и наибольшая) по сравнению с остальными оказываются чрезмерно большими или чрезмерно малыми.

В дискретном вариационном ряду, содержащем нечетное число единиц, медиана равна варианте признака, имеющей номер
<img border=«0» width=«92» height=«41» src=«ref-1_832898988-260.coolpic» v:shapes="_x0000_i1037">:

<img border=«0» width=«72» height=«37» src=«ref-1_832899248-207.coolpic» v:shapes="_x0000_i1038">,
где N— число единиц совокупности.

В дискретном ряду, состоящем из четного числа единиц совокупности, медиана определяется как средняя из вариант, имеющих номера
<img border=«0» width=«21» height=«41» src=«ref-1_832899455-128.coolpic» v:shapes="_x0000_i1039"> и <img border=«0» width=«51» height=«41» src=«ref-1_832899583-190.coolpic» v:shapes="_x0000_i1040">: <img border=«0» width=«113» height=«56» src=«ref-1_832899773-322.coolpic» v:shapes="_x0000_i1041">.
В распределении рабочих по стажу работы медиана равна средней из вариант, имеющих в ранжированном ряду номера 10: 2 = 5 и 10: 2 + 1 = 6. Варианты пятого и шестого признака равны 4 годам, таким образом
<img border=«0» width=«102» height=«41» src=«ref-1_832900095-252.coolpic» v:shapes="_x0000_i1042">года
При вычислении медианы в интервальном ряду сначала находят медианный интервал, (т.е. содержащий медиану), для чего используют накопленные частоты или частости. Медианным является интервал, накопленная частота которого равна или превышает половину всего объема совокупности. Затем значение медианы рассчитывается по формуле:
<img border=«0» width=«224» height=«64» src=«ref-1_832900347-651.coolpic» v:shapes="_x0000_i1043">,
где <img border=«0» width=«31» height=«24» src=«ref-1_832900998-119.coolpic» v:shapes="_x0000_i1044">  — нижняя граница медианного интервала; <img border=«0» width=«33» height=«24» src=«ref-1_832901117-129.coolpic» v:shapes="_x0000_i1045">  — ширина медианного интервала; <img border=«0» width=«49» height=«24» src=«ref-1_832901246-151.coolpic» v:shapes="_x0000_i1046">  — накопленная частота интервала, предшествующего медианному; <img border=«0» width=«28» height=«24» src=«ref-1_832901397-124.coolpic» v:shapes="_x0000_i1047">  — частота медианного интервала.

Рассчитаем медиану ряда распределения рабочих по размеру зарплаты (см. лекцию «Сводка и группировка статистических данных»).

Медианным является интервал заработной платы 800-900 грн., поскольку его кумулятивная частота равна 17, что превышает половину суммы всех частот (<img border=«0» width=«55» height=«41» src=«ref-1_832901521-183.coolpic» v:shapes="_x0000_i1048">). Тогда
Ме=800+100<img border=«0» width=«95» height=«60» src=«ref-1_832901704-288.coolpic» v:shapes="_x0000_i1049">грн.
Полученное значение говорит о том, половина рабочих имеют заработную плату ниже 875 грн., но это выше среднего ее размера.

Для определения медианы можно вместо кумулятивных частот <img border=«0» width=«20» height=«23» src=«ref-1_832901992-103.coolpic» v:shapes="_x0000_i1050"> использовать кумулятивные частости <img border=«0» width=«24» height=«24» src=«ref-1_832902095-108.coolpic» v:shapes="_x0000_i1051">.

Медиана, как и мода, не зависит от крайних значений вариант, поэтому также применяется для характеристики центра в рядах распределения с неопределенными границами.

Свойство медианы: сумма абсолютных величин отклонений вариант от медианы меньше, чем от любой другой величины (в том числе и от средней арифметической):
<img border=«0» width=«113» height=«27» src=«ref-1_832902203-337.coolpic» v:shapes="_x0000_i1052">
Это свойство медианы используется на транспорте при проектировании расположения трамвайных и троллейбусных остановок, бензоколонок, сборочных пунктов и т. д.

Пример. На шоссе длиной 100 км расположено 10 гаражей. Для проектирования строительства бензоколонки были собраны данные о числе предполагаемых ездок на заправку по каждому гаражу.
Таблица 2 — Данные о количестве ездок на заправку по каждому гаражу.



Нужно поставить бензоколонку так, чтобы общий пробег автомашин на заправку был наименьшим.

Вариант 1. Если бензоколонку поставить в середине шоссе, т.е. на 50-ом километре (центр диапазона изменения признака), то пробеги с учетом числа ездок составят:

а) в одном направлении:
<img border=«0» width=«554» height=«21» src=«ref-1_832902540-1061.coolpic» v:shapes="_x0000_i1053">;
б) в противоположном:
<img border=«0» width=«436» height=«23» src=«ref-1_832903601-887.coolpic» v:shapes="_x0000_i1054">;
в) общий пробег в оба направления: <img border=«0» width=«152» height=«19» src=«ref-1_832904488-271.coolpic» v:shapes="_x0000_i1055">.

Вариант 2. Если бензоколонку поставить на среднем участке шоссе, определенном по формуле средней арифметической с учетом числа ездок:
<img border=«0» width=«512» height=«36» src=«ref-1_832904759-855.coolpic» v:shapes="_x0000_i1056">
Тогда пробеги составят:

а) в одном направлении:
<img border=«0» width=«440» height=«45» src=«ref-1_832905614-1577.coolpic» v:shapes="_x0000_i1057"><img border=«0» width=«12» height=«23» src=«ref-1_832907191-73.coolpic» v:shapes="_x0000_i1058">
б) в противоположном:
<img border=«0» width=«419» height=«23» src=«ref-1_832907264-849.coolpic» v:shapes="_x0000_i1059">;
в) общий пробег в оба направления, равный <img border=«0» width=«203» height=«21» src=«ref-1_832908113-344.coolpic» v:shapes="_x0000_i1060"> меньше, чем в первом варианте на 438,5 км.

Вариант 3. Если поставить бензоколонку на 78-м километре, что будет соответствовать медиане по количеству ездок (накопленное число ездок для 60 км — 95, для 78 км — 125).

Тогда пробеги составят:

а) в одном направлении:
<img border=«0» width=«364» height=«45» src=«ref-1_832908457-1357.coolpic» v:shapes="_x0000_i1061">
б) в противоположном:
<img border=«0» width=«240» height=«23» src=«ref-1_832909814-553.coolpic» v:shapes="_x0000_i1062">;
в) общий пробег: <img border=«0» width=«145» height=«19» src=«ref-1_832910367-262.coolpic» v:shapes="_x0000_i1063">, меньше общих пробегов, рассчитанных по предыдущим вариантам.

Таким образом, медиане соответствует наилучший результат, т.е. минимальный общий пробег.

Медиану можно определить графически, по кумуляте (см. лекцию «Сводка и группировка статистических данных»). Для этого последнюю ординату, равную сумме всех частот или частостей, делят пополам. Из полученной точки восстанавливают перпендикуляр до пересечения с кумулятой. Абсцисса точки пересечения и дает значение медианы.


    продолжение
--PAGE_BREAK--1.3 Показатели дифференциации


Если возникает необходимость изучить структуру вариационного ряда более подробно, вычисляют значения признака, аналогичные медиане. Такие значения признака, которые делят все единицы распределения на равные численности, называют квантилями, или градиентами. Квартили и децили — частные случаи квантилей.

Квартилями (Q) называют значения признака, которые делят совокупность на четыре равные по числу единиц части. Децили (D) — признаки, делящие совокупность на десять равных частей.

Следовательно, кроме медианы, в ряду распределения имеются три квартиля и девять децилей. Медиана одновременно является вторым квартилем и пятым децилем. Расчет первого (Q1) и третьего (Q3) квартилей аналогичен расчету медианы, только вместо медианного интервала берется для первого квартиля интервал, в котором находится варианта, отсекающая ј численности частот, а для третьего квартиля — ѕ численности частот:
<img border=«0» width=«192» height=«67» src=«ref-1_832910629-595.coolpic» v:shapes="_x0000_i1064"> и <img border=«0» width=«197» height=«67» src=«ref-1_832911224-599.coolpic» v:shapes="_x0000_i1065">.
Логика построения квинтилей и децилей аналогична.

2. Характеристики вариации


Показатели вариации характеризует колеблемость индивидуальных значений признака по отношению к среднему значению, что не менее важно, чем определение самой средней. Средняя не показывает строения совокупности, как располагаются около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом эти отличия велики, т.е. в одном случае вариация признака мала, а в другом велика.

Это можно показать на таком примере. Предположим, что две бригады из 3-х человек каждая выполняют одинаковую работу. Количество деталей, изготовленных за смену отдельными рабочими, составило:

в первой бригаде — 95, 100, 105;

во второй бригаде — 75, 100, 125.

Средняя выработка на одного рабочего в бригадах составила
<img border=«0» width=«191» height=«41» src=«ref-1_832911823-411.coolpic» v:shapes="_x0000_i1066">, <img border=«0» width=«195» height=«41» src=«ref-1_832912234-411.coolpic» v:shapes="_x0000_i1067">.
Средняя выработка одинакова, но колеблемость выработки отдельных рабочих в первой бригаде значительно меньше, чем во второй.

Следовательно, чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своей средней, и наоборот — варианты, мало отличающиеся друг от друга, более близки по значению к средней, которая в таком случае будет более реально представлять всю совокупность.

Поэтому для характеристики и измерения вариации признака в совокупности кроме средней используют следующие показатели:

абсолютные — вариационный размах, среднее линейное и среднее квадратическое отклонение, дисперсию;

относительные — коэффициенты вариации.

2.1 Абсолютные характеристики вариации


Вариационный размах (или размах вариации) — это разница между максимальным и минимальным значениями признака:
<img border=«0» width=«112» height=«24» src=«ref-1_832912645-206.coolpic» v:shapes="_x0000_i1068">
В нашем примере размах вариации сменной выработки рабочих составляет: в первой бригаде R=105-95=10 дет., во второй бригаде R=125-75=50 дет. (в 5 раз больше). Это говорит о том, что выработка 1-й бригады более «устойчива», но резервов роста выработки больше у второй бригады, т.к в случае достижения всеми рабочими максимальной для этой бригады выработки, ею может быть изготовлено 3*125=375 деталей, а в 1-й бригаде только 105*3=315 деталей.

Если крайние значения признака не типичны для совокупности, то используют квартильный или децильный размахи. Квартильный размах RQ= Q3-Q1 охватывает 50% объема совокупности, децильный размах первый RD1 = D9-D1охватывает 80% данных, второй децильный размах RD2= D8-D2 — 60%.

Недостатком показателя вариационного размаха является, но что его величина не отражает все колебания признака.

Простейшим обобщающим показателем, отражающим все колебания признака, является среднее линейное отклонение, представляющее собой среднюю арифметическую абсолютных отклонений отдельных вариант от их средней величины: для несгруппированных данных
<img border=«0» width=«92» height=«45» src=«ref-1_832912851-366.coolpic» v:shapes="_x0000_i1069">,
для сгруппированных данных
<img border=«0» width=«109» height=«49» src=«ref-1_832913217-447.coolpic» v:shapes="_x0000_i1070">,



где хi— значение признака в дискретном ряду или середина интервала в интервальном распределении.

В вышеприведенных формулах разности в числителе взяты по модулю, иначе, согласно свойству средней арифметической, числитель всегда будет равен нулю. Поэтому среднее линейное отклонение в статистической практике применяют редко, только в тех случаях, когда суммирование показателей без учета знака имеет экономический смысл. С его помощью, например, анализируется состав работающих, рентабельность производства, оборот внешней торговли.

Дисперсия признака — это средний квадрат отклонений вариант от их средней величины:

простая дисперсия
<img border=«0» width=«148» height=«47» src=«ref-1_832913664-438.coolpic» v:shapes="_x0000_i1071">,
взвешенная дисперсия
<img border=«0» width=«157» height=«51» src=«ref-1_832914102-510.coolpic» v:shapes="_x0000_i1072">.
Формулу для расчета дисперсии можно упростить:
<img border=«0» width=«548» height=«77» src=«ref-1_832914612-1987.coolpic» v:shapes="_x0000_i1073">
Таким образом, дисперсия равна разности средней из квадратов вариант и квадрата средней из вариант совокупности:



<img border=«0» width=«239» height=«55» src=«ref-1_832916599-805.coolpic» v:shapes="_x0000_i1074">.
Однако, вследствие суммирования квадратов отклонений дисперсия дает искаженное представление об отклонениях, поэтому ее на основе рассчитывают среднее квадратическое отклонение, которое показывает, на сколько в среднем отклоняются конкретные варианты признака от их среднего значения. Вычисляется путем извлечения квадратного корня из дисперсии:

для несгруппированных данных
<img border=«0» width=«156» height=«51» src=«ref-1_832917404-506.coolpic» v:shapes="_x0000_i1075">,
для вариационного ряда
<img border=«0» width=«133» height=«55» src=«ref-1_832917910-527.coolpic» v:shapes="_x0000_i1076">
Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее совокупность, тем более надежной (типичной) будет средняя величина.

Среднее линейное и среднее квадратичное отклонение — именованные числа, т.е. выражаются в единицах измерения признака, идентичны по содержанию и близки по значению. Рассчитывать абсолютные показатели вариации рекомендуется с помощью таблиц.
Таблица 3 — Расчет характеристик вариации (на примере срока данных о сменной выработке рабочих бригады)



Среднесменная выработка рабочих:
<img border=«0» width=«200» height=«48» src=«ref-1_832919764-600.coolpic» v:shapes="_x0000_i1084">
Среднее линейное отклонение:



<img border=«0» width=«255» height=«49» src=«ref-1_832920364-713.coolpic» v:shapes="_x0000_i1085">
Дисперсия выработки:
<img border=«0» width=«267» height=«51» src=«ref-1_832921077-723.coolpic» v:shapes="_x0000_i1086">
Среднее квадратическое отклонение выработки отдельных рабочих от средней выработки:
<img border=«0» width=«217» height=«29» src=«ref-1_832921800-389.coolpic» v:shapes="_x0000_i1087">.

    продолжение
--PAGE_BREAK--2.1.1 Расчет дисперсии способом моментов
Вычисление дисперсий связано с громоздкими расчетами (особенно если средняя величина выражена большим числом с несколькими десятичными знаками). Расчеты можно упростить, если использовать упрощенную формулу и свойства дисперсии.

Дисперсия обладает следующими свойствами:

если все значения признака уменьшить или увеличить на одну и ту же величину А, то дисперсия от этого не уменьшится:
<img border=«0» width=«297» height=«55» src=«ref-1_832922189-941.coolpic» v:shapes="_x0000_i1088">,
если все значения признака уменьшить или увеличить в одно и то же число раз (hраз), то дисперсия соответственно уменьшится или увеличится в <img border=«0» width=«21» height=«24» src=«ref-1_832923130-106.coolpic» v:shapes="_x0000_i1089"> раз.

То есть, если дисперсию уменьшенных значений признака описать следующим выражением
<img border=«0» width=«169» height=«76» src=«ref-1_832923236-732.coolpic» v:shapes="_x0000_i1090">, то <img border=«0» width=«89» height=«28» src=«ref-1_832923968-204.coolpic» v:shapes="_x0000_i1091"> или <img border=«0» width=«197» height=«81» src=«ref-1_832924172-796.coolpic» v:shapes="_x0000_i1092">
Используя свойства дисперсии и сначала уменьшив все варианты совокупности на величину А, а затем разделив на величину интервала h, получим формулу вычисления дисперсии в вариационных рядах с равными интервалами способом моментов:

<img border=«0» width=«320» height=«64» src=«ref-1_832924968-1045.coolpic» v:shapes="_x0000_i1093">,
где <img border=«0» width=«21» height=«24» src=«ref-1_832926013-103.coolpic» v:shapes="_x0000_i1094"> — дисперсия, исчисленная по способу моментов;

h— величина интервала вариационного ряда;
<img border=«0» width=«77» height=«41» src=«ref-1_832926116-209.coolpic» v:shapes="_x0000_i1095">  — новые (преобразованные) значения вариант;
А- постоянная величина, в качестве которой используют середину интервала, обладающего наибольшей частотой; либо вариант, имеющий наибольшую частоту;
<img border=«0» width=«105» height=«55» src=«ref-1_832926325-482.coolpic» v:shapes="_x0000_i1096"> — квадрат момента первого порядка;

<img border=«0» width=«87» height=«51» src=«ref-1_832926807-389.coolpic» v:shapes="_x0000_i1097">  — момент второго порядка.
Выполним расчет дисперсии способом моментов на основе данных о сменной выработке рабочих бригады.
Таблица 4 — Расчет дисперсии по способу моментов



Порядок расчета:

определяем постоянное число А, это варианта с наибольшей частотой: А=220;

определяем <img border=«0» width=«88» height=«41» src=«ref-1_832927835-247.coolpic» v:shapes="_x0000_i1103">;

рассчитываем <img border=«0» width=«37» height=«23» src=«ref-1_832928082-121.coolpic» v:shapes="_x0000_i1104"> и <img border=«0» width=«29» height=«27» src=«ref-1_832927708-127.coolpic» v:shapes="_x0000_i1105">;

определяем моменты 1-го и 2-го порядка:
<img border=«0» width=«223» height=«55» src=«ref-1_832928330-760.coolpic» v:shapes="_x0000_i1106">

<img border=«0» width=«164» height=«51» src=«ref-1_832929090-545.coolpic» v:shapes="_x0000_i1107">
рассчитываем дисперсию:

<img border=«0» width=«332» height=«28» src=«ref-1_832929635-530.coolpic» v:shapes="_x0000_i1108">

    продолжение
--PAGE_BREAK--2.1.2 Расчет дисперсии альтернативного признака
Среди признаков, изучаемых статистикой, есть и такие, которым свойственны лишь два взаимно исключающих значения.

Это альтернативные признаки.

Им придается соответственно два количественных значения: варианты 1 и 0.

Частостью варианты 1, которая обозначается p, является доля единиц, обладающих данным признаком. Разность 1-р=qявляется частостью варианты 0. Таким образом,





Средняя арифметическая альтернативного признака
<img border=«0» width=«121» height=«44» src=«ref-1_832930165-310.coolpic» v:shapes="_x0000_i1109">, т.кp+q=1.
Дисперсия альтернативного признака
<img border=«0» width=«293» height=«48» src=«ref-1_832930475-665.coolpic» v:shapes="_x0000_i1110">, т.к1-р=q
Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, и доли единиц, не обладающих этим признаком.

Если значения 1 и 0 встречаются одинаково часто, т.е. p=q, дисперсия достигает своего максимума pq=0,25.

Дисперсия альтернативного признака используется в выборочных обследованиях, например, качества продукции.

2.1.3 Межгрупповая дисперсия. Правило сложения дисперсий
Дисперсия, в отличие от других характеристик вариации, является аддитивной величиной. То есть в совокупности, которая разделена на группы по факторному признаку х, дисперсия результативного признака y может быть разложена на дисперсию в каждой группе (внутригрупповую) и дисперсию между группами (межгрупповую). Тогда, наряду с изучением вариации признака по всей совокупности в целом, становится возможным изучение вариации в каждой группе, а также между этими группами.

Общая дисперсия<img border=«0» width=«21» height=«24» src=«ref-1_832926013-103.coolpic» v:shapes="_x0000_i1111">измеряет вариацию признака у по всей совокупности под влиянием всех факторов, вызвавших эту вариацию (отклонения). Она равна среднему квадрату отклонений отдельных значений признака у от общей средней <img border=«0» width=«15» height=«25» src=«ref-1_832931243-97.coolpic» v:shapes="_x0000_i1112"> и может быть вычислена как простая или взвешенная дисперсия.

Межгрупповая дисперсия <img border=«0» width=«20» height=«24» src=«ref-1_832931340-105.coolpic» v:shapes="_x0000_i1113"> характеризует вариацию результативного признака у, вызванную влиянием признака-фактора х, положенного в основу группировки. Она характеризует вариацию групповых средних и равна среднему квадрату отклонений групповых средних <img border=«0» width=«19» height=«27» src=«ref-1_832931445-106.coolpic» v:shapes="_x0000_i1114"> от общей средней <img border=«0» width=«15» height=«25» src=«ref-1_832931243-97.coolpic» v:shapes="_x0000_i1115">:
<img border=«0» width=«121» height=«90» src=«ref-1_832931648-634.coolpic» v:shapes="_x0000_i1116">,
где <img border=«0» width=«18» height=«23» src=«ref-1_832932282-98.coolpic» v:shapes="_x0000_i1117">  — средняя арифметическая i-той группы;

<img border=«0» width=«15» height=«23» src=«ref-1_832896501-96.coolpic» v:shapes="_x0000_i1118">  — численность единиц в i-той группе (частота i-той группы);

<img border=«0» width=«14» height=«20» src=«ref-1_832932476-91.coolpic» v:shapes="_x0000_i1119">  — общая средняя совокупности.

Внутригрупповая дисперсия <img border=«0» width=«21» height=«27» src=«ref-1_832932567-111.coolpic» v:shapes="_x0000_i1120"> отражает случайную вариацию, т.е. ту часть вариации, которая вызвана влиянием неучтенных факторов и не зависит от признака-фактора, положенного в основу группировки. Она характеризует вариацию индивидуальных значений относительно групповых средних, равна среднему квадрату отклонений отдельных значений признака у внутри группы от средней арифметической этой группы (групповой средней) <img border=«0» width=«17» height=«27» src=«ref-1_832932678-102.coolpic» v:shapes="_x0000_i1121"> и вычисляется как простая или взвешенная дисперсия для каждой группы:
<img border=«0» width=«119» height=«45» src=«ref-1_832932780-404.coolpic» v:shapes="_x0000_i1122"> или <img border=«0» width=«129» height=«49» src=«ref-1_832933184-484.coolpic» v:shapes="_x0000_i1123">,
где <img border=«0» width=«13» height=«14» src=«ref-1_832933668-85.coolpic» v:shapes="_x0000_i1124">  — число единиц в группе.

На основании внутригрупповых дисперсий по каждой группе можно определить общую среднюю из внутригрупповых дисперсий:
<img border=«0» width=«84» height=«49» src=«ref-1_832933753-402.coolpic» v:shapes="_x0000_i1125">.
Взаимосвязь между тремя дисперсиями получила название правила сложения дисперсий, согласно которому общая дисперсия равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий:
<img border=«0» width=«92» height=«29» src=«ref-1_832934155-214.coolpic» v:shapes="_x0000_i1126">

Пример. При изучении влияния тарифного разряда (квалификации) рабочих на уровень производительности их труда получены следующие данные.
Таблица 5 — Распределение рабочих по среднечасовой выработке.



В данном примере рабочие разделены на две группы по факторному признаку х- квалификации, которая характеризуется их разрядом. Результативный признак <img border=«0» width=«19» height=«23» src=«ref-1_832934369-96.coolpic» v:shapes="_x0000_i1134">  — выработка — варьируется как под его влиянием (межгрупповая вариация), так и за счет других случайных факторов (внутригрупповая вариация). Задача заключается в измерении этих вариаций с помощью трех дисперсий: общей, межгрупповой и внутригрупповой.

Определяем групповые и общую средние выработки, шт:
по первой группе <img border=«0» width=«135» height=«45» src=«ref-1_832935379-433.coolpic» v:shapes="_x0000_i1135">шт.,

по второй группе <img border=«0» width=«87» height=«41» src=«ref-1_832935812-232.coolpic» v:shapes="_x0000_i1136">шт.,

по двум группам <img border=«0» width=«271» height=«49» src=«ref-1_832936044-719.coolpic» v:shapes="_x0000_i1137">шт.
Рассчитываем и заносим в таблицу <img border=«0» width=«51» height=«25» src=«ref-1_832936763-140.coolpic» v:shapes="_x0000_i1138"> и <img border=«0» width=«65» height=«27» src=«ref-1_832936903-175.coolpic» v:shapes="_x0000_i1139">.

Рассчитываем внутригрупповые дисперсии:
по первой группе <img border=«0» width=«177» height=«45» src=«ref-1_832937078-503.coolpic» v:shapes="_x0000_i1140">,

по второй группе <img border=«0» width=«81» height=«41» src=«ref-1_832937581-226.coolpic» v:shapes="_x0000_i1141">
Внутригрупповые дисперсии показывают вариации выработки в каждой группе, вызванные всеми возможными факторами (состояние оборудования, обеспеченность материалами и инструментами, возраст рабочих и т.д.), кроме различий в квалификации, т.к внутри группы все рабочие имеют одинаковый разряд.

Вычисляем среднюю из внутригрупповых дисперсий:
<img border=«0» width=«196» height=«49» src=«ref-1_832937807-605.coolpic» v:shapes="_x0000_i1142">
Средняя дисперсия отражает вариацию выработки, обусловленную всеми факторами, кроме квалификации, но в среднем по совокупности.

Межгрупповая дисперсия, характеризует вариацию среднегрупповых выработок, вызванную различием групп рабочих по квалификационному разряду:
<img border=«0» width=«399» height=«49» src=«ref-1_832938412-966.coolpic» v:shapes="_x0000_i1143">
Вычисляем общую дисперсию совокупности, которая отражает суммарное влияние всех возможных факторов на общую вариацию выработки изделий всеми рабочими:
<img border=«0» width=«544» height=«72» src=«ref-1_832939378-1445.coolpic» v:shapes="_x0000_i1144">
Определяем общую дисперсию по правилу сложения дисперсий:
<img border=«0» width=«155» height=«29» src=«ref-1_832940823-294.coolpic» v:shapes="_x0000_i1145">
Очевидно, что чем выше доля межгрупповой дисперсии <img border=«0» width=«20» height=«24» src=«ref-1_832931340-105.coolpic» v:shapes="_x0000_i1146"> в общей дисперсии <img border=«0» width=«21» height=«24» src=«ref-1_832926013-103.coolpic» v:shapes="_x0000_i1147">, тем сильнее влияние факторного признака (разряда) на результативный (выработку).

Эта доля характеризуется эмпирическим коэффициентом детерминации:
<img border=«0» width=«61» height=«48» src=«ref-1_832941325-213.coolpic» v:shapes="_x0000_i1148">
Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака х. Остальная часть общей вариации у вызвана изменением прочих факторов.

В примере эмпирический коэффициент детерминации равен:
<img border=«0» width=«141» height=«48» src=«ref-1_832941538-354.coolpic» v:shapes="_x0000_i1149"> или 66,7%,
Это означает, что на 66,7% вариация производительности труда рабочих обусловлена различиями в квалификации, а на 33,3% — влиянием прочих факторов.

Эмпирическое корреляционное отношение показывает тесноту связи между группировочным и результативными признаками. Рассчитывается как корень квадратный из эмпирического коэффициента детерминации:
<img border=«0» width=«63» height=«52» src=«ref-1_832941892-258.coolpic» v:shapes="_x0000_i1150">
Эмпирическое корреляционное отношение <img border=«0» width=«13» height=«17» src=«ref-1_832942150-87.coolpic» v:shapes="_x0000_i1151">, как и <img border=«0» width=«21» height=«27» src=«ref-1_832942237-106.coolpic» v:shapes="_x0000_i1152">, может принимать значения от 0 до 1.

Если связь отсутствует, то <img border=«0» width=«13» height=«17» src=«ref-1_832942150-87.coolpic» v:shapes="_x0000_i1153">=0. В этом случае <img border=«0» width=«20» height=«24» src=«ref-1_832931340-105.coolpic» v:shapes="_x0000_i1154">=0, то есть групповые средние равны между собой и межгрупповой вариации нет. Значит группировочный признак — фактор не влияет на образование общей вариации.

Если связь функциональная, то <img border=«0» width=«13» height=«17» src=«ref-1_832942150-87.coolpic» v:shapes="_x0000_i1155">=1. В этом случае дисперсия групповых средних равна общей дисперсии (<img border=«0» width=«56» height=«24» src=«ref-1_832942622-151.coolpic» v:shapes="_x0000_i1156">), то есть внутригрупповой вариации нет. Это означает, что группировочный признак полностью определяет вариацию изучаемого результативного признака.

Чем ближе значение корреляционного отношения к единице, тем теснее, ближе к функциональной зависимости связь между признаками.

Для качественной оценки тесноты связи между признаками пользуются соотношениями Чэддока.





В примере <img border=«0» width=«131» height=«27» src=«ref-1_832942873-287.coolpic» v:shapes="_x0000_i1158">, что свидетельствует о тесной связи между производительностью труда рабочих и их квалификацией.

    продолжение
--PAGE_BREAK--
еще рефераты
Еще работы по математике