Реферат: Математическая статистика

Математическая статистикаТипы средних величин

Средняявеличина – это обобщенная количественная характеристика признака встатистической совокупности в конкретных условиях места и времени, котораявыражает типичные черты и дает обобщающую характеристику однотипных явлений поодному из варьирующих признаков.

Сущность среднейзаключается в том, что в ней взаимопогашаются отклонения значений признакаотдельных единиц, обусловленные действием случайных факторов, и учитываютсяизменения, вызванные действием факторов основных. Это позволяет среднейотражать типичный уровень признака и абстрагироваться от индивидуальныхособенностей, присущих отдельным единицам.

Категориюсредней можно раскрыть следующим образом: средняя, являясь обобщающей характеристикойвсей совокупности, должна ориентироваться на определенную величину, связаннуюсо всеми единицами этой совокупности – />. Если в данной функции всевеличины х1 и т.д. заменить их средней величиной />, то значение этойфункции должно остаться прежним, то есть />=/>.

На практикеопределить среднюю во многих случаях можно через исходное соотношение средней(ИСС) или ее логическую формулу.

/>

Например,требуется найти среднее выборочное вариационного ряда: 1,2,2,3,3,4,6. Для нахождениявоспользуемся формулой ИСС:

/>

Значит,среднее выборочное вариационного ряда равно 3.

В каждомконкретном случае для реализации исходного соотношения потребуется одна изследующих форм средней величины:

− Средняяарифметическая

− Средняягармоническая

− Средняягеометрическая

− Средняяквадратическая, кубическая и т.д.

Перечисленныесредние объединяются в общей формуле средней степенной (при различной величинек)

/>

Средняя арифметическая

Эта формасредней является наиболее распространенной и используется в тех случаях, когдарасчет осуществляется по несгруппированным данным. В зависимости от характераимеющихся данных может быть простой или взвешенной.

Предположим,шесть торговых предприятий фирмы имеют следующий объем товарооборота в млн.руб. за месяц:

№1 – 38

№2 – 25

№3 – 41

№4 – 27

№5 – 19

№6 – 29

Для того,чтобы определить средний месячный товарооборот в расчете на одно предприятие,необходимо воспользоваться следующим исходным соотношением:


/>

Используязнакомые условные обозначения, запишем формулу для данной средней:

/>

С учетомэтого получим 29,8 млн. руб. В данном случае мы использовали формулу среднейарифметической простой (невзвешенной).

Средняя арифметическаявзвешенная

При расчетесредних величин отдельные значения осредняемого признака могут повторяться,встречаться по несколько раз. В подобных случаях расчет средней производится посгруппированным данным или вариационным рядам, которые могут быть дискретнымиили интервальными.

Например,есть данные о сделках по акциям эмитента «х» за торговую сессию: сделка №1– 700 акций по 420 руб., сделка №2 – 200 по 440 руб., сделка №3 – 950 по 410рублей. Определим по данному дискретному вариационному ряду средний курспродажи одной акции, что можно сделать только используя следующее исходноесоотношение:

ИСС= />

В конечномитоге имеем:

/>

Расчетсреднего курса продажи произведен по формуле средней арифметической взвешенной.

В отдельныхслучаях, веса могут быть представлены не абсолютными величинами, а относительными(в процентах или долях единицы). Так, в приведенном выше примере количествопроданных в ходе каждой сделки акций соответственно составляют: 37,8%, 10,8%,51,4%

Тогдаполучим:

/>, или х=420*0,378+440*0,108+410*0,514=417,03руб.

На практикенаиболее частая ошибка заключается в игнорировании весов в тех случаях, когдаони необходимы. Предположим, что имеются данные о себестоимости единицыпродукции по двум предприятиям №1 – 37, №2 – 39 руб. Среднюю себестоимостьданной продукции можно определить только в том случае, если объемы производствана двух предприятиях совпадают. Тогда средняя себестоимость составит 38 руб.

Но, на первомпредприятии за рассматриваемый период может быть произведено, к примеру, 50единиц продукции, а на втором – 700 единиц. Тогда для расчета среднейсебестоимости потребуется уже средняя арифметическая взвешенная />

Выводы:

1)Использовать среднюю арифметическую невзвешенную можно только тогда, когдаточно установлено отсутствие весов или их равенство.

2) Прирасчете средней по интервальному вариационному ряду для выполнения необходимыхвычислений от интервалов переходят к их серединам.

Средняягармоническая взвешенная используется, когда известен числитель исходногосоотношения средней, но неизвестен его знаменатель. Рассмотрим расчет среднейурожайности, являющейся одним из основных показателей эффективностипроизводства в агробизнесе.

Допустим,есть несколько районов:

А –валовый сбор в тыс. тонн 52, урожайность 10 ц./га

Б – 40 тыс.тонн и 14 ц/га

В – 31 и15

Г – 67 и 8

Средняяурожайность любой сельскохозяйственной культуры в среднем по несколькимтерриториям, агрофирмам может быть определена только на основе следующегоисходного соотношения:

/>

Общий валовойсбор получим простым суммированием валового сбора по районам. Данные о посевнойплощади получим, разделив валовой сбор каждого района на урожайность. С учетомэтого определим искомую среднюю, предварительно переведя для сопоставимоститонны в центнеры.

/>

Такимобразом, общая посевная площадь данной культуры в целом по области составляла 185,2тыс. га, а средняя урожайность – 10,3 ц. с одного гектара. В данном случае расчетпроизведен по формуле средней гармонической взвешенной

/>

Даннаяформула используется для расчета средних показателей не только в статике, но ив динамике, когда известны индивидуальные значения признака и веса за зарядвременных интервалов.

Средняягармоническая невзвешенная

Эта формасредней используется значительно реже, имеет следующий вид: />.

Она можетиспользоваться вместо взвешенной в тех случаях, когда значения wi<sub/>для единиц совокупностиравны. Взвешенные средние используются на практике чаще невзвешенных, посколькудостаточно реже имеют место ситуации, когда веса осредняемых вариантов равны.

Средняягеометрическая

Еще однойформулой, по которой может осуществляться расчет среднего показателя, являетсясредняя геометрическая. Наиболее широкое применение этот вид средней получил ванализе динамике для определения среднего темпа роста.

/>

 

х – цепной коэффициентроста (варьирующий признак), n – количество периодов, по которым имеютсякоэффициенты роста.

Предположим,что имеются следующие данные о темпах роста товарооборота фирмы за ряд лет:

Годы2000 г. 2001 г. 2002 г. 2003 г.

Темпы ростатоварооборота (%) 102, 5 109,2 112, 4 101, 5.

Определимсредние темпы роста с 2000 по 2003 годы. Значение темпов роста переводим изпроцентов в коэффициенты и подставляем в формулу средней геометрической.

/>

Такимобразом, средние темпы роста товарооборота фирмы составляют 1, 063 или 106,3% в год.

Среднегодовыетемпы роста могут рассчитываться с использованием другой формулы среднейгеометрической:

/>

Удобстводанной формулы состоит в том, что при расчете не требуются данные за все годыпериода.

Средняяквадратическая

В основевычислений ряда сводных расчетных показателей лежит средняя квадратическая:

/>

Наиболеешироко этот вид средней используется при расчете показателей вариации,коэффициентов структурных сдвигов, индексов.

Структурные средние

Структурныесредние являются особым видом средних величин и применяются для изучениявнутреннего строения и структуры рядов распределения значений признака. К такимпоказателям относятся мода и медиана.

Мода Мо– значение случайной величины, встречающееся с набольшей вероятностью вдискретном вариационном ряду – вариант, имеющий наибольшую частоту (встречаетсячаще всего).

Винтервальных рядах распределения с равными интервалами модой приближенносчитают центральный вариант модального интервала, то есть того интервала,который имеет наибольшую частоту. Значение моды для интервального рядавычисляется по формуле:

/>

Модальныйинтервал определяется по наибольшей частоте. Рассмотрим нахождение моды напримере величины стажа работников на предприятии:

Стаж (лет) до2 лет 2–4 4–6 6–8 8–10 более 10

Числоработников: 4 2 20 35 11 7

Модальныминтервалом в данном случае является интервал 6–8 лет, так как именно этотинтервал соответствует самой многочисленной (35 человек) группе сотрудников:

М0=/>.

Мода широкоиспользуется в статистической практике при изучении покупательского спроса,регистрации цен и т.д.

Медиана Ме– это вариант, который находится в середине вариационного ряда. Медиана делитряд на две равные (по числу единиц) части – со значениями признака меньшемедианы и со значениями признака больше медианы. Чтобы найти медиану,необходимо отыскать значение признака, которое находится в серединеупорядоченного ряда.

Вранжированных рядах несгруппированных данных нахождение медианы сводится котысканию порядкового номера медианы. Номер медианы для нечетного объемавычисляется по формуле:

/>

где n – число членов ряда.

В случае четногообъема ряда медиана равна средней из двух вариантов, находящихся в серединеряда.

Винтервальных рядах распределения медианное значение оказывается в каком-то изинтервалов признака x. Этот интервал характерен тем, что егокумулятивная частота (накопленная сумма частот) равна или превышает полусуммувсех частот ряда. Значение медианы вычисляется линейной интерполяцией поформуле:

/>

/>

Медиана, каки мода, широко используется в маркетинговых исследованиях.

Для глубокогоанализа изучаемого процесса, информации о средних уровнях исследуемыхпоказателей обычно бывает недостаточно. Необходимо учитывать разброс иливариацию значений отдельных единиц, которая является важной характеристикойизучаемой совокупности.

Вариация –это многообразие, изменчивость значения признака у единиц совокупности. Онапорождается комплексом условий, действующих на совокупность и ее единицы.Например, вариация оценок на экзамене в вузе порождается: различнымиспособностями, временем подготовки, наличием или отсутствием мотивации.

Вматематической части решения этой задачи общая теория статистики опирается на математическуюстатистику, в которой излагается математическая сторона таких показателейвариации, как размах вариации, среднее линейное определение, дисперсия, среднееквадратическое отклонение, коэффициент вариации.

Всепоказатели вариации делятся на две группы: абсолютные и относительные.

К абсолютнымпоказателям относятся: размах вариации, среднее линейное отклонение, дисперсияи среднее квадратическое отклонение.

Размахвариации (R) – вычисляется как разность между наибольшим и наименьшимзначениями варьирующего признака

 

R=xmin-xmax.

Онпоказывает, насколько велико различие между единицами совокупности, имеющимисамое маленькое и самое большое значение признака. Например, различие междуминимальной и максимальной пенсиями.

Егоособенности определяются, во-первых, зависимостью лишь от двух крайних значенийпризнака, а во-вторых, он не учитывает частот в вариационном рядураспределения.

Показательразмаха вариации дает обобщающую характеристику только границам (амплитуде)значений признака, но не дает характеристики вариации распределению отклонений.Распределение отклонений можно уловить, вычислив отклонения всех вариант отсредней. А для того, чтобы дать им обобщающую характеристику, необходимо далеевычислить среднюю из этих отклонений, то есть разности между значением признакаи средней арифметической в данной совокупности единиц.

Израссмотренных ранее свойств средней арифметической нам известно, что суммаотклонений значений признака от нее всегда равна нулю, так как суммаположительных отклонений всегда равна сумме отрицательных отклонений.Следовательно, чтобы вычислить среднюю арифметическую из отклонений, нужноусловно допустить, что все отклонения, положительные и отрицательные, имеютодинаковый знак.

Далее возьмемсумму всех отклонений, условно принятых с одинаковым знаком, и разделим их наих число и полученный показатель вариации будет называться средним линейнымотклонением (d), то есть это средняя арифметическая из абсолютных значенийотклонений отдельных вариантов от их средней арифметической.

Если каждыйвариант в ряду распределения повторяется один раз, то среднее линейноеотклонение равно:

/>

Длявариационного ряда с неравными частотами формула имеет следующий вид:

/>


Среднеелинейное отклонение обладает большим преимуществом перед размахом вариации вотношении полноты характеристики колеблемости признака. Однако при этом внекотором смысле нарушается элементарное правило математики, так как отклонениеот среднего значения признака складывается без учета знаков. В некоторыхслучаях суммирование показателей без учета знаков имеет экономический смысл. Например,в практической статистике оборот внешней торговли страны определяется как суммаэкспорта и импорта, общий оборот рабочей силы – как сумма принятых и уволенных ит.д.

Математическим ожиданием дискретной случайной величины Х называетсясумма произведений ее всех возможных значений на соответствующие вероятности.Математическое ожидание (МО) обозначается через М(Х) или mх.

Отметим, чтоматематическое ожидание случайной величины является величиной постоянной. Егочасто называют средним (статистическим) значением случайной величины, а такжецентром распределения, т. к. около него группируются отдельные значенияслучайной величины.

Дисперсия – средний квадратотклонения значений признака от их средней величины. Если каждый вариантповторяется один раз, то дисперсия равна:

/>

/>Для вариационного ряда снеравными частотами формула примет вид:

/>


или D(X) = /> (по определению математического ожидания)

Квадратныйкорень из дисперсии носит название среднего квадратического отклонения отсредней. Формулы его расчета следующие:

/>или />

Элементарныеалгебраические преобразования приводят формулу к виду: />.

еще рефераты
Еще работы по математике