Реферат: Методика обработки экспериментальных данных

Задание на курсовуюработу

 

1. Построить вариационныйряд

2. Рассчитать числовыехарактеристики статистического ряда:

а) Размах варьирования.

б) Среднее арифметическоезначение.

в) Оценки дисперсии.

г) Оценкисреднеквадратического отклонения.

д) Мода.

е) Медиана.

ж) Коэффициент вариации.

3. Построить полигон игистограмму относительных частот.

4. Построить эмпирическуюфункцию распределения.

5. Построить статистическуюпроверку гипотезы по нормальному распределению с помощью критерии Пирсона илиКолмогорова.

6. Вычислить асимметрию иэксцесс.

7. Построить доверительныеинтервалы, для математического ожидания и среднеквадратического отклонения длянадежности 95%.

8. Выводы.

Данные по выборке вариант34

-678 -752 -624 -727 -612 -632 -704 -697 -627 -727 -561 -748 -686 -676 -676 -696 -717 -694 -700 -707 -680 -681 -687 -656 -692 -644 -805 -758 -695 -722 -706 -704 -681 -608 -647 -699 -658 -686 -689 -643 -701 -716 -731 -623 -693 -703 -731 -700 -765 -697 -662 -705 -667 -677 -701 -678 -667 -673 -697 -701 -597 -716 -689 -694 -695 -729 -700 -717 -647 -673 -690 -578 -703 -688 -666 -670 -671 -693 -688 -646 -667 -689 -711 -731 -604 -691 -675 -686 -670 -703 -696 -702 -660 -662 -681 -666 -677 -645 -746 -685

 


1. Построениевариационного ранжированного ряда

Сортируем экспериментальные данные повозрастанию. Получаем вариационный ряд.

Таблица 1

-805 -727 -705 -700 -695 -689 -681 -673 -662 -632 -765 -727 -704 -700 -694 -688 -680 -671 -660 -627 -758 -722 -704 -700 -694 -688 -678 -670 -658 -624 -752 -717 -703 -699 -693 -687 -678 -670 -656 -623 -748 -717 -703 -697 -693 -686 -677 -667 -647 -612 -746 -716 -703 -697 -692 -686 -677 -667 -647 -608 -731 -716 -702 -697 -691 -686 -676 -667 -646 -604 -731 -711 -701 -696 -690 -685 -676 -666 -645 -597 -731 -707 -701 -696 -689 -681 -675 -666 -644 -578 -729 -706 -701 -695 -689 -681 -673 -662 -643 -561

Вывод: Вариационный ряд послужит нам для облегчениядальнейших расчетов, и для определения относительных частот и разделения наинтервалы и расчета ряда числовых характеристик.

 


2. Расчет числовых характеристик статистического ряда

2.1 Размах варьирования

Размах варьированиявычисляется по формуле:

/> (2.1)

где R – размахварьирования;

xmax – максимальный элементвариационного ряда;

xmin<sub/>– минимальный элементвариационного ряда;

xmax= – 561

xmin<sub/>= -805

R = -561+805=244

 

2.2 Среднеарифметическоезначение статистического ряда

/>
/> (2.2)

где ni –частота варианты xi;

xi – варианта выборки;

n = ∑ ni – объем выборки;

Распределение выборкипредставлено в таблице 2.

Таблица 2

Xi n Xi n Xi n Xi n Xi n Xi n Xi n -805 1 -717 2 -700 3 -689 3 -675 1 -647 2 -608 1 -765 1 -716 2 -699 1 -688 2 -673 2 -646 1 -604 1 -758 1 -711 1 -697 3 -687 1 -671 1 -645 1 -597 1 -752 1 -707 1 -696 2 -686 3 -670 2 -644 1 -578 1 -748 1 -706 1 -695 2 -685 1 -667 3 -643 1 -561 1 -746 1 -705 1 -694 2 -681 3 -666 2 -632 1 -731 3 -704 2 -693 2 -680 1 -662 2 -627 1 -729 1 -703 3 -692 1 -678 2 -660 1 -624 1 -727 2 -702 1 -691 1 -677 2 -658 1 -623 1 -722 1 -701 3 -690 1 -676 2 -656 1 -612 1

/>

2.3 Оценка дисперсии

/>

/> (2.3)

где s2 – несмещенная оценкагенеральной дисперсии;

/>

/>

2.4 Оценка среднегоквадратического отклонения

/>                 (2.4)


/>

 

2.5 Определение моды

Модой называют варианту снаибольшей частотой повторений.

Из таблицы 2 находим, чтонаибольшую частоту n=3имеют варианты x = -731, x = -703,x = -701,x = -700,x = -697, x = -689,x = -686, x = -681, x = -667.

2.6 Определение медианы

Если количество вариантчисло четное, то медиана вычисляется по формуле:

 

МВ=(xk+xk+1)/2      (2.5.)

где xk – пятидесятый членвариационного ряда;

xk+1 – пятьдесят первый членвариационного ряда;

nКоличество вариант и n=2*k

МВ=(xk+xk+1)/2=(-689–689)/2= -689

 

2.7 Расчет коэффициентавариации

Расчет коэффициентавариации проведем по формуле:

 

/> (2.6)

 

/>

Вывод:

Размах варьированияявляется простейшей характеристикой рассеяния вариационного ряда.

Для того чтобыохарактеризовать рассеяние значений количественного признака X генеральной совокупностивокруг своего среднего значения, вводят сводные характеристики – генеральнуюдисперсию и средним квадратическим отклонением.

Коэффициент вариациислужит для сравнения величин рассеяния по отношению к выборочной средней двухвариационных рядов: тот из рядов имеет большее рассеяние, у которогокоэффициент больше (эта величина безразмерная поэтому он пригоден для сравнениявариационных рядов, варианты которых имеют различную размерность.

В целом числовыехарактеристики служат для сравнения рассеяния вариационных рядов в сравнении саналогичными числовыми характеристиками других вариационных рядов.


3. Построение полигона и гистограммы относительных частот

Для построениягистограммы и полигона относительных частот поделим вариационный ряд (табл. 1)на частичные интервалы. Результаты занесем в таблицу 3.

Таблица 3

Номер интервала

I

Частичный интервал xi–xx+1

Сумма относительных частот

wi

Плотность частот

/>

xi

xx+1

1 -805 -780,6 0,01 0,00041 2 -780,6 -756,2 0,02 0,00082 3 -756,2 -731,8 0,03 0,00123 4 -731,8 -707,4 0,12 0,00492 5 -707,4 -683 0,4 0,01639 6 -683 -658,6 0,24 0,00984 7 -658,6 -634,2 0,08 0,00328 8 -634,2 -609,8 0,05 0,00205 9 -609,8 -585,4 0,03 0,00123 10 -585,4 -561 0,02 0,00082

По таб. 3 строимгистограмму относительных частот (рис. 1).

Полигон получаемсоединением вершин столбцов гистограммы. (рис. 1) Полигон получаем соединениемвершин столбцов гистограммы.

/>


/>

 

/>

Рис 1.

Вывод: Полигон игистограмму – графики статистического распределения строят для наглядностиотносительных частот в выборке.



4. Построение эмпирическойфункции распределения

Эмпирическая функцияраспределения выборки находится по формуле:

/> (4.1)

где nx – число вариант меньших х;

n объем выборки.

По формуле (4.1) построимэмпирическую функцию распределения.

/>

Для более точного иправильного построения возьмем середины интервалов:

F(x) Интервал X< -792,8 0,01 -792,8 <x< -768,4 0,02 -768,4 <x< -744 0,03 -744 <x< -719,6 0,05 -719,6 <x< -695,2 0,08 -695,2 <x< -670,8 0,12 -670,8 <x< -646,4 0,19 -646,4 <x< -622 0,27 -622 <x< -597,6 0,41 -597,6 <x< -573,2 0,67 -573,2 <x< -548,8 1 x> -548,8

Вывод:

Итак, эмпирическаяфункция распределения выборки служит для оценки теоретической функциираспределения генеральной совокупности



5. Статистическаяпроверка гипотезы о нормальном распределении с помощью критерия Пирсона илиКолмагорова

 

Проверку проводим спомощью критерия Пирсона.

В этом задании, с помощьюкритерии Пирсона проверим гипотезу о нормальном распределении генеральнойсовокупности, с этой целью будем сравнивать эмпирические и теоретическиечастоты.

/>  – Среднееарифметическое значение

/>        – Количествовариантов

/>       – Шаг интервалов

/>     – Оценкасреднеквадратического отклонения.

/>

Вычислим данные потаблице:

 

I ni Xi X (i+1) Zi Z (I+1)

/>

/>

/>

/>

/>

1 1 -805 -780,6 -2,7340 -0,5 -0,469 3,1 1,4226 0,3226 2 1 -780,6 -756,2 -2,7340 -2,1140 -0,469 -0,408 6,1 4,2639 0,1639 3 4 -756,2 -731,8 -2,1140 -1,4941 -0,408 -0,285 12,3 5,6008 1,3008 4 7 -731,8 -707,4 -1,4941 -0,8741 -0,285 -0,099 18,6 7,2344 2,6344 5 26 -707,4 -683 -0,8741 -0,2542 -0,099 0,1141 21,31 1,0322 31,7222 6 33 -683 -658,6 -0,2542 0,3658 0,1141 0,2939 17,98 12,5473 60,5673 7 14 -658,6 -634,2 0,3658 0,9857 0,2939 0,4131 11,92 0,3630 16,4430 8 8 -634,2 -609,8 0,9857 1,6057 0,4131 0,4713 5,82 0,8166 10,9966 9 3 -609,8 -585,4 1,6057 2,2256 0,4713 0,4927 2,14 0,3456 4,2056 10 3 -585,4 -561 2,2256 0,4927 0,5 0,73 7,0588 12,3288 СУММА 100 100 40,6851 140,6851 /> /> /> /> /> /> /> /> /> /> /> /> />

X2набл=40,685

Контроль: />140,685–100=40,685

Исходя из требований,чтобы вероятность попадания критерия в критическую область в предположениисправедливости нулевой гипотезы была равна принятому уровню значимости />.

/>

Таким образом,правосторонняя критическая область определяется неравенством />, а область принятия нулевойгипотезы – неравенством/>.

Уровень значимости /> = 0,05;

По таблице критическихточек распределения χ² (приложение 3), по уровню значимости α = 0,05 и числу степенейсвободы K=10–3=7находим критическую точку правосторонней критической области χ²кр (0,05; 7) =14,1.

Вывод: Так как X2набл> X2кр, то нулевую гипотезу отвергают,значит гипотезу о нормальном распределении отвергают.


6. Расчет асимметрии иэксцесса

 

Асимметрия – отношениецентрального момента 3-го порядка к кубу среднего квадратического отклонения.

/>, где />

Эксцесс – характеристика«крутости» рассматриваемой случайной величины.

/>, где />

Значение ХВ, s вычисляем по формулам:

/>,

где С – Ложный нуль(варианта, которая имеет наибольшую частоту).

/>,

где h – шаг (разность междудвумя соседними вариантами);

/>(условный момент второго порядка);

/>(условный момент первогопорядка);

/>(условная варианта).

Расчеты занесем в таблицу7:


Xi

Ni

Ui

XB

M1

M2

s m3 m4

AS

EK

-805 1 -2,73 -684,67 0,30 1,06 23,97 3433,28 4193007,72 0,25 12,71 -780,6 1 -2,11 -756,2 4 -1,49 -731,8 7 -0,87 -707,4 26 -0,25 -683 33 0,37 -658,6 14 0,99 -634,2 8 1,61 -609,8 3 2,23 -585,4 3 2,85

Вывод:

Т.к. асимметрия положительнато ‘длинная часть’ кривой распределения расположена справа от математическогоожидания или мода.

Т.к. Эксцесс больше нуля,то кривая распределения имеет более высокую и ‘острую’ вершину, чем нормальнаякривая.



7. Построениедоверительного интервала для математического ожидания и среднегоквадратического отклонения

Доверительный интервалдля математического ожидания (с вероятностью g) находят как:

/> (7.1)

где n – объем выборки;

tg – случайная величина имеющее распределение Стьюдента находим поприложению 1.

s – исправленное среднееквадратическое отклонение;

/>– выборочное среднее;

Найдем интервал:

по приложению 1 находим tg<sub/>= 1.984 при g = 0.95 и n= 100;

/>=-684,67; s= 38,19;

Получаем

/>

-692,25<a<-677.09

Доверительный интервалдля среднего квадратического отклонения

(с надежностью g) находят как:

/> при q<1 (7.2)

/> при q>1 (7.3)

где q находят по приложению 2,по заданным n и g;

Исходя из приложения 2, n = 100 и g = 0.95 находим q=0.143;

Поэтому интервал находимпо формуле (7.2):

/> <td/>

38.19(1-0.143)</><38.19(1+0.143) 35,58(1+0.143)

 

32.73 < /> < 43.65

Вывод:

Итак, с надежностью 0,95неизвестное математическое ожидание ‘а’ находится в доверительном интервале -692,25<a<-677.09, анеизвестное среднее квадратическое отклонение ‘’ находиться вдоверительном интервале 32.73 < /> < 43.65.



Вывод

Для представления генеральной совокупности я исследовала выборку,которая имеет объём 100 элементов.

Я нашла:

размах варьирования R=244;

среднеарифметическоезначение статистического ряда />=-684,67;

несмещенную оценкугенеральной дисперсии s2=1458,99;

среднее квадратическоеотклонение s=38,19;

медиану МВ=-689и коэффициент вариации V= />5,58%.

С надежностью 0.95 оценилматематическое ожидание в интервале

-692,25< а < -677,09

и среднее квадратическоеотклонение в интервале

32,73 < /> < 43,65

Выборка имеет варианты x = -731, x = -703,x = -701,x = -700,x = -697, x = -689,x = -686, x = -681, x = -667, которыевстречаются 3 раза.

На рис. 1 построила гистограмму и полигон относительных частот. Порис. 1 можно выдвинуть гипотезу о нормальном распределении генеральнойсовокупности.

После проверки гипотезы о нормальном распределении с помощьюкритерия Пирсона при a=0.05, яотвергла ее. Из этого следует, что расхождения между практическими итеоретическими частотами значимо.

Асимметрия as=0,25. Из этого следует, что правое крыло функции более вытянуто относительноее моды.

Эксцесс ek=12,71. Из-за того, что у эксцесса положительный знак,эмпирическая функция распределения острее по сравнению с теоретическимраспределением.


Список литературы

1. Гмурман В.Е. Руководство к решению задач по теориивероятностей и математической статистике. М.: Высшая школа, 2001.

2. Гмурман В.Е. Теория вероятностей и математическаястатистика.

М.: Высшая школа, 2001.

еще рефераты
Еще работы по математике