Реферат: Математическая статистика

Содержание

 

Введение

1. Предмет и методы математической статистики

2. Основные понятия математической статистики

2.1 Основные понятия выборочного метода

2.2 Выборочное распределение

2.3 Эмпирическая функция распределения, гистограмма

Заключение

Список литературы


Введение

Математическаястатистика — наука о математических методах систематизации и использованиястатистических данных для научных и практических выводов. Во многих своихразделах математическая статистика опирается на теорию вероятностей,позволяющую оценить надежность и точность выводов, делаемых на основанииограниченного статистического материала (напр., оценить необходимый объемвыборки для получения результатов требуемой точности при выборочномобследовании).

В теориивероятностей рассматриваются случайные величины с заданным распределением илислучайные эксперименты, свойства которых целиком известны. Предмет теориивероятностей — свойства и взаимосвязи этих величин (распределений).

Но частоэксперимент представляет собой черный ящик, выдающий лишь некие результаты, покоторым требуется сделать вывод о свойствах самого эксперимента. Наблюдательимеет набор числовых (или их можно сделать числовыми) результатов, полученныхповторением одного и того же случайного эксперимента в одинаковых условиях.

При этомвозникают, например, следующие вопросы: Если мы наблюдаем одну случайнуювеличину — как по набору ее значений в нескольких опытах сделать как можноболее точный вывод о ее распределении?

Примеромтакой серии экспериментов может служить социологический опрос, наборэкономических показателей или, наконец, последовательность гербов и решек притысячекратном подбрасывании монеты.

Всевышеприведенные факторы обуславливают актуальность и значимость тематикиработы на современном этапе, направленной на глубокое и всестороннее изучение основныхпонятий математической статистики.

В связи сэтим целью данной работы является систематизация, накопление и закреплениезнаний о понятиях математической статистики.


1.  Предмет и методы математической статистики

Математическаястатистика — наука о математических методах анализа данных, полученных припроведении массовых наблюдений (измерений, опытов). В зависимости отматематической природы конкретных результатов наблюдений статистикаматематическая делится на статистику чисел, многомерный статистический анализ,анализ функций (процессов) и временных рядов, статистику объектов нечисловойприроды. Существенная часть статистики математической основана на вероятностныхмоделях. Выделяют общие задачи описания данных, оценивания и проверки гипотез.Рассматривают и более частные задачи, связанные с проведением выборочныхобследований, восстановлением зависимостей, построением и использованиемклассификаций (типологий) и др.

Дляописания данных строят таблицы, диаграммы, иные наглядные представления,например, корреляционные поля. Вероятностные модели обычно не применяются.Некоторые методы описания данных опираются на продвинутую теорию и возможностисовременных компьютеров. К ним относятся, в частности, кластер-анализ,нацеленный на выделение групп объектов, похожих друг на друга, и многомерноешкалирование, позволяющее наглядно представить объекты на плоскости, внаименьшей степени исказив расстояния между ними.

Методыоценивания и проверки гипотез опираются на вероятностные модели порожденияданных. Эти модели делятся на параметрические и непараметрические. Впараметрических моделях предполагается, что изучаемые объекты описываютсяфункциями распределения, зависящими от небольшого числа (1-4) числовыхпараметров. В непараметрических моделях функции распределения предполагаютсяпроизвольными непрерывными. В статистике математической оценивают параметры ихарактеристики распределения (математическое ожидание, медиану, дисперсию,квантили и др.), плотности и функции распределения, зависимости междупеременными (на основе линейных и непараметрических коэффициентов корреляции, атакже параметрических или непараметрических оценок функций, выражающих зависимости)и др. Используют точечные и интервальные (дающие границы для истинных значений)оценки.

Вматематической статистике есть общая теория проверки гипотез и большое числометодов, посвященных проверке конкретных гипотез. Рассматривают гипотезы означениях параметров и характеристик, о проверке однородности (то есть осовпадении характеристик или функций распределения в двух выборках), о согласииэмпирической функции распределения с заданной функцией распределения или спараметрическим семейством таких функций, о симметрии распределения и др.

Большоезначение имеет раздел математической статистики, связанный с проведениемвыборочных обследований, со свойствами различных схем организации выборок ипостроением адекватных методов оценивания и проверки гипотез.

Задачивосстановления зависимостей активно изучаются более 200 лет, с момента разработкиК. Гауссом в 1794 г. метода наименьших квадратов. В настоящее время наиболееактуальны методы поиска информативного подмножества переменных инепараметрические методы.

Разработкаметодов аппроксимации данных и сокращения размерности описания была начатаболее 100 лет назад, когда К. Пирсон создал метод главных компонент. Позднеебыли разработаны факторный анализ[1] и многочисленныенелинейные обобщения.

Различныеметоды построения (кластер-анализ), анализа и использования (дискриминантныйанализ) классификаций (типологий) именуют также методами распознавания образов(с учителем и без), автоматической классификации и др.

Математическиеметоды в статистике основаны либо на использовании сумм (на основе ЦентральнойПредельной Теоремы теории вероятностей) или показателей различия (расстояний,метрик), как в статистике объектов нечисловой природы. Строго обоснованы обычнолишь асимптотические результаты. В настоящее время компьютеры играют большуюроль в математической статистике. Они используются как для расчетов, так и дляимитационного моделирования (в частности, в методах размножения выборок и приизучении пригодности асимптотических результатов).


2.Основные понятия математической статистики/>2.1 Основныепонятия выборочного метода

Пусть />— случайнаявеличина, наблюдаемая в случайном эксперименте. Предполагается, чтовероятностное пространство задано (и не будет нас интересовать).

Будемсчитать, что, проведя />раз этот эксперимент водинаковых условиях, мы получили числа />, />, />,/>—значения этой случайной величины в первом, втором, и т.д. экспериментах.Случайная величина />имеет некотороераспределение />, которое намчастично или полностью неизвестно.

Рассмотримподробнее набор />, называемый выборкой/>.

В серииуже произведенных экспериментов выборка — это набор чисел. Но если эту сериюэкспериментов повторить еще раз, то вместо этого набора мы получим новый наборчисел. Вместо числа />появится другое число— одно из значений случайной величины />. То есть />(и />, и/>,и т.д.) — переменная величина, которая может принимать те же значения, что ислучайная величина />, и так же часто (стеми же вероятностями). Поэтому до опыта />— случайная величина,одинаково распределенная с />, а после опыта —число, которое мы наблюдаем в данном первом эксперименте, т.е. одно извозможных значений случайной величины />.

Выборка/> />объема />— это набор из />независимыхи одинаково распределенных случайных величин («копий />»), имеющих, как и />,распределение />.

Что значит«по выборке сделать вывод о распределении»? Распределение характеризуетсяфункцией распределения, плотностью или таблицей, набором числовых характеристик— />, />, />и т.д. По выборке нужно уметь строить приближениядля всех этих характеристик.

/>2.2Выборочное распределение

Рассмотримреализацию выборки на одном элементарном исходе />— набор чисел />, />, />.На подходящем вероятностном пространстве введем случайную величину />,принимающую значения />, />, />свероятностями по />(если какие-то иззначений совпали, сложим вероятности соответствующее число раз). Таблицараспределения вероятностей и функция распределения случайной величины />выглядяттак:/>

/>

/> 

/> 

/> 

/>

/>

/> 

/>

<p/>

/>

Распределениевеличины />называют эмпирическим/>/> иливыборочным/>/> распределением. Вычислимматематическое ожидание и дисперсию величины />и введем обозначениядля этих величин:/>/>

/>

Точно также вычислим и момент порядка />/>

/>

В общемслучае обозначим через />величину

/>

Если припостроении всех введенных нами характеристик считать выборку />, />,/> наборомслучайных величин, то и сами эти характеристики — />, />, />, />, /> — станутвеличинами случайными. Эти характеристики выборочного распределения используютдля оценки (приближения) соответствующих неизвестных характеристик истинногораспределения.

Причинаиспользования характеристик распределения />для оценкихарактеристик истинного распределения />(или />) — вблизости этих распределений при больших />.

Рассмотрим,для примера, />подбрасыванийправильного кубика. Пусть />—количество очков, выпавших при />-м броске, />. Предположим, что единица в выборке встретится />раз,двойка — />раз и т.д. Тогда случайная величина />будет приниматьзначения 1, />, 6 с вероятностями/>, />,/> соответственно.Но эти пропорции с ростом />приближаются к />согласнозакону больших чисел. То есть распределение величины />в некотором смыслесближается с истинным распределением числа очков, выпадающих при подбрасыванииправильного кубика.

Мы нестанем уточнять, что имеется в виду под близостью выборочного и истинногораспределений. В следующих параграфах мы подробнее познакомимся с каждой извведенных выше характеристик и исследуем ее свойства, в том числе ее поведениес ростом объема выборки.

/>2.3Эмпирическая функция распределения, гистограмма

Посколькунеизвестное распределение />можно описать,например, его функцией распределения />,построим по выборке «оценку» для этой функции./>

Определение1.

Эмпирическойфункцией распределения, построенной по выборке />объема />, называется случайнаяфункция />, прикаждом />равная

/>

/>Напоминание: Случайнаяфункция

/>

называетсяиндикатором события />. При каждом />это —случайная величина, имеющая распределение Бернулли с параметром />. почему?

Иначеговоря, при любом />значение />, равноеистинной вероятности случайной величине />быть меньше />,оценивается долей элементов выборки, меньших />.

Еслиэлементы выборки />, />, />упорядочитьпо возрастанию (на каждом элементарном исходе), получится новый набор случайныхвеличин, называемый вариационным рядом/>:

/>

Здесь

/>

Элемент />,/>, называется />-м членом вариационногоряда или />-й порядковой статистикой/>/>.

Пример1./>

Выборка: />

Вариационныйряд: />

/>Рис. 1. Пример 1

/>

Эмпирическаяфункция распределения имеет скачки в точках выборки, величина скачка в точке />равна/>,где />— количество элементов выборки, совпадающих с />.

Можнопостроить эмпирическую функцию распределения по вариационному ряду:

/>

Другойхарактеристикой распределения является таблица (для дискретных распределений)или плотность (для абсолютно непрерывных). Эмпирическим, или выборочныманалогом таблицы или плотности является так называемая гистограмма/>.

Гистограммастроится по группированным данным. Предполагаемую область значений случайнойвеличины />(или область выборочных данных) делят независимо от выборки нанекоторое количество интервалов (не обязательно одинаковых). Пусть />, />,/>—интервалы на прямой, называемые интервалами группировки/>.Обозначим для />через />числоэлементов выборки, попавших в интервал />:

 />

 (1)

На каждомиз интервалов />строят прямоугольник,площадь которого пропорциональна />. Общая площадь всехпрямоугольников должна равняться единице. Пусть />— длина интервала />.Высота />прямоугольника над />равна

/>

Полученнаяфигура называется гистограммой.

Пример2./>

Имеетсявариационный ряд (см. пример 1):

/>

Разобьемотрезок />на 4 равных отрезка. В отрезок />попали 4элемента выборки, в />— 6, в />— 3, и в отрезок />попали 2элемента выборки. Строим гистограмму (рис. 2). На рис. 3 — тоже гистограмма длятой же выборки, но при разбиении области на 5 равных отрезков.

/>/>/>/>Рис. 2. Пример 2

Рис. 3. Пример 2

/>

Замечание1.

/>Вкурсе «Эконометрика» утверждается, что наилучшим числом интервалов группировки(«формула Стерджесса»)/>/> является />.

Здесь />— десятичный логарифм, поэтому />,т.е. при увеличении выборки вдвое число интервалов группировки увеличивается на1. Заметим, что чем больше интервалов группировки, тем лучше. Но, если братьчисло интервалов, скажем, порядка />, то с ростом />гистограммане будет приближаться к плотности.

Справедливоследующее утверждение:

Еслиплотность распределения элементов выборки является непрерывной функцией, то при/>так, что />, имеет местопоточечная сходимость по вероятности гистограммы к плотности.

Так чтовыбор логарифма разумен, но не является единственно возможным.


Заключение

Математическая(или теоретическая) статистика опирается на методы и понятия теориивероятностей, но решает в каком-то смысле обратные задачи.

Если мынаблюдаем одновременно проявление двух (или более) признаков, т.е. имеем наборзначений нескольких случайных величин — что можно сказать об их зависимости?Есть она или нет? А если есть, то какова эта зависимость?

Частобывает возможно высказать некие предположения о распределении, спрятанном в«черном ящике», или о его свойствах. В этом случае по опытным данным требуетсяподтвердить или опровергнуть эти предположения («гипотезы»). При этом надопомнить, что ответ «да» или «нет» может быть дан лишь с определенной степеньюдостоверности, и чем дольше мы можем продолжать эксперимент, тем точнее могутбыть выводы. Наиболее благоприятной для исследования оказывается ситуация,когда можно уверенно утверждать о некоторых свойствах наблюдаемого эксперимента— например, о наличии функциональной зависимости между наблюдаемыми величинами,о нормальности распределения, о его симметричности, о наличии у распределенияплотности или о его дискретном характере, и т.д.

Итак, о(математической) статистике имеет смысл вспоминать, если

·          имеется случайный эксперимент,свойства которого частично или полностью неизвестны,

·          мы умеем воспроизводить этотэксперимент в одних и тех же условиях некоторое (а лучше — какое угодно) число раз.


Список литературы

1.   Баумоль У. Экономическая теория и исследование операций.– М.; Наука, 1999.

2.   Большев Л.Н., Смирнов Н.В. Таблицы математическойстатистики. М.: Наука, 1995.

3.   Боровков А.А. Математическая статистика. М.: Наука,1994.

4.   Корн Г., Корн Т. Справочник по математике для научныхработников и инженеров. — СПБ: Издательство «Лань», 2003.

5.   Коршунов Д.А., Чернова Н.И. Сборник задач и упражненийпо математической статистике. Новосибирск: Изд-во Института математики им.С.Л.Соболева СО РАН, 2001.

6.   Пехелецкий И.Д. Математика: учебник для студентов. — М.: Академия, 2003.

7.   Суходольский В.Г. Лекции по высшей математике длягуманитариев. — СПБ Издательство Санкт-петербургского государственного университета.2003

8.   Феллер В. Введение в теорию вероятностей и ееприложения. — М.: Мир, Т.2, 1984.

9.   Харман Г., Современный факторный анализ. — М.:Статистика, 1972.

еще рефераты
Еще работы по математике