Реферат: Статистические величины

Сущность и значениесредних величин.

В результате группировкиединиц совокупности по величине варьирующего признака получают рядыраспределения — первичную характеристику массовой статистической совокупности.Чтобы охарактеризовать такую совокупность в целом, часто пользуются среднейвеличиной.

Средняя величина — обобщающая характеристика изучаемого признака в исследуемой совокупности. Онаотражает его типичный уровень в расчете на единицу совокупности в конкретныхусловиях места и времени.

Метод средних величинзаключается в замене индивидуальных значений варьирующего признака единицнаблюдения, т.е. в замене x1, x2, x3,… xnнекоторой уравненной величиной />.

Средние величиныприменяются для оценки достигнутого уровня изучаемого показателя, при анализе ипланировании производственно-хозяйственной деятельности предприятий(объединений), фирм, банков и других хозяйственных единиц; средние используютсяпри выявлении взаимосвязей явлений, при прогнозировании, а также расчетенормативов. Средняя величина всегда именованная, имеет ту же размерность(единицу измерения), что и признак у отдельных единиц совокупности.

Основным условиемнаучного использования средней величины является качественная однородностьсовокупности, по которой исчислена средняя. Поэтому очень важное правило — вычислять средние величины лишь по однородной совокупности единиц. Только привыполнении этого условия средняя как обобщающая характеристика отражает общее,типичное, закономерное, присущее всем единицам исследуемой совокупности. Преждечем вычислять средние величины, необходимо произвести группировку единицисследуемой совокупности, выделив качественно однородные группы.

Средняя, рассчитанная посовокупности в целом, называется общей средней, средние, исчисленные длякаждой группы, — групповыми средними .

Общая средняя отражаетобщие черты изучаемого явления, групповая средняя дает характеристику размераявления, складывающуюся в конкретных условиях данной группы.

Средняя арифметическаяпростая и взвешенная.

Если имеется несколькоразличных индивидуальных величин одного и того же вида и надо исчислитьсреднюю, то необходимо найти сумму всех индивидуальных величин и поделитьполученную сумму на их число.

Обозначим индивидуальныезначения признака через x1, x2, x3, ...xn, число индивидуальных величин — n,среднюю величину -/>.

Средняя величина,вычисленная по формуле:

/>

называется средней арифметическойпростой.

Средняя арифметическаяпростая равначастному от деления суммы индивидуальных значений признака на их количество.

Пример. Требуетсявычислить средний стаж работы 12 работников туристической фирмы. При этомизвестны индивидуальные значения признака (стажа) в годах: 6, 4, 5, 4, 3, 3, 5,6, 3, 7, 4, 5.

/>

Как видим, средняяарифметическая может оказаться дробным числом, если даже индивидуальныезначения признака заданы только целыми числами. Это вытекает из сущностисредней арифметической, которая есть величина абстрактная (теоретическая), т.е.она может принимать такое числовое значение, которое не встречается впредставленной совокупности индивидуальных значений признака.

Под средней арифметической понимается такое значениепризнака, которое имела бы каждая единица совокупности, если бы общий итог всехзначений признака был распределен равномерно между всеми единицамисовокупности.

Средняя арифметическаяпростая применяется в тех случаях, когда каждое индивидуальное значениепризнака встречается один (или одинаковое число) раз. Другими словами, средняяарифметическая простая рассчитывается по группировочным единицам совокупности.

Но чаще бывает так, чтоотдельные значения исследуемой совокупности встречаются не один, а много,причем не одинаковое число раз, т.е. представляют собой ряд распределения.

В эти случаяхрассчитывают среднюю арифметическую взвешенную.

Средняя арифметическаявзвешенная равна сумме произведений вариант (x) на их частоты или веса (f),поделенной на сумму частот.

Обозначим индивидуальныезначения признака (варианты) x1, x2, x3, ...xn,а числа, показывающие, сколько раз повторяется варианта (частоты) — f1,f2, f3,… fn, то средняя арифметическаявзвешенная будет равна:

/>

Заметим, что в нашемпримере одно и то же значение признака встречается несколько раз. Объединивданные по величине признака и подсчитав число случаев повторения каждого изних, проведем расчет среднего стажа по сгруппированным данным с помощью формулысредней взвешенной арифметической.

Стаж работы, годы 3 4 5 6 7 Итого Количество работников, человек 3 3 3 2 1 12

/>

Средняя арифметическаявзвешенная, по которой производился расчет в рассмотренном примере, не имеетпринципиальных отличий от простой средней арифметической (средние, рассчитанныепо разным формулам совпадают), просто суммирование f раз одного и того жезначения признака (варианта) заменено в ней умножением варианта на f.

При этом величина среднейзависит уже не только от величины индивидуальных значений признака (как впростой средней арифметической), но и от соотношения их весов (частот). Чембольшие веса имеют малые значения вариантов, тем меньше величина средней инаоборот.

Вычисление среднейарифметической интервального ряда.

Вариационные рядыполучаются в результате группировок, причем часто группировочные признаки показаныне одной величиной, а в определенных интервалах. Такие ряды называются интервальные.

Вычисление средней изинтервального ряда имеет некоторые особенности. Для того, чтобы рассчитатьсреднюю арифметическую интервального ряда, надо сначала определить среднюю длякаждого интервала, а затем — среднюю для всего ряда.

Средняя для каждогоинтервала определяется как полусумма верхней и нижней границ, т.е. по формулесредней арифметической простой.

Определение варианты какполусуммы верхней и нижней границ интервального ряда исходит из предположения,что индивидуальные значения признака внутри интервала распределяются равномернои, следовательно, средние значения интервалов достаточно близко примыкают ксредней арифметической в каждой группе.

В действительности это невсегда так, поэтому средние, вычисленные из интервальных рядов, являютсяприблизительными.

Свойства среднейарифметической.

Средняя арифметическаяобладает некоторыми свойствами, которые определяют ее широкое применение вэкономических расчетах и в практике статистического исследования.

Свойство 1. Средняя арифметическаяпостоянной величины равна этой постоянной:

/>

Свойство 2 (нулевое). Алгебраическая суммалинейных отклонений (разностей) индивидуальных значений признака от среднейарифметической равна нулю:

/>для первичного ряда и />длясгруппированных данных (di — линейные (индивидуальные) отклонения отсредней, т.е. xi — />).

Это свойство можносформулировать следующим образом: сумма положительных отклонений от среднейравна сумме отрицательных отклонений.

Логически оно означает,что все отклонения от средней в ту и в другую сторону, обусловленные случайнымипричинами, взаимно погашаются.

Свойство 3(минимальное). Сумма квадратов отклонений индивидуальных значений признака отсредней арифметической есть число минимальное:

/>

что означает: суммаквадратов отклонений индивидуальных значений признака каждой единицысовокупности от средней арифметической всегда меньше суммы квадратов отклоненийвариантов признака от любого значения (А), сколь угодно мало отличающегося отсредней у выбранной единицы исследуемой совокупности.

Для сгруппированныхданных имеем:

/>

Минимальное и нулевоесвойства средней арифметической применяются для проверки правильности расчетасреднего уровня признака; при изучении закономерностей изменения уровней рядадинамики; для нахождения параметров уравнения регрессии при изучениикорреляционной связи между признаками.

Рассмотренные свойствавыражают сущностные черты средней арифметической. Существуют также расчетные(вычислительные) свойства средней арифметической, имеющие прикладное значение:

если значения признака каждой единицы совокупности (все усредняемые варианты) уменьшить или увеличить на одну и ту же величину А, то и со средней арифметической произойдут аналогичные изменения; если значения признака каждой единицы совокупности разделить или умножить на какое-либо постоянное число А, то средняя арифметическая уменьшится или увеличится в А раз; если вес (частоту) каждого значения признака разделить на какое-либо постоянное число А, то средняя арифметическая не изменится.

В настоящее времявычислительные свойства средней арифметической потеряли свою актуальность всвязи с использованием ЭВМ при расчете обобщающих статистических показателей.

Абсолютные и относительные статистическиевеличины.

 

Результаты статистического наблюдениярегистрируются в виде первичных абсолютных величин. Абсолютная величина отражает уровень развития явления. В статистике все абсолютные величиныявляются именованными, измеряются в конкретных единицах. И в отличие отматематического  понятия абсолютные величины могут быть.как положительными,так и отрицательными. Абсолютные величины делятся на:

1)    Индивидуальные – характеризуют размерпризнака отдельных единиц совокупности.

2)    Суммарные. Характеризуют итоговоезначение признака по определённой части совокупности. Они разделяются на:

a)    моментные — показывают фактическоеналичие на определённый момент или дату.

b)   интервальные — итоговый накопленный результат  за период в целом. В отличие от моментных, онидопускают их последующее суммирование.

 Абсолютная величина не даёт представления об изучаемомявлении, не показывает его структуру, соотношение между  отдельными частями иразвития во времени. Эти функции выполняют относительные  показатели.Относительная величина – это обобщающий показатель, который даёт числовую меру соотношения двух  сопоставляемых абсолютных величин. Основное условие правильного расчёта относительной величины – это сопоставимость сравниваемыхпоказателей и наличие реальных связей между изучаемыми явлениями. Такимобразом, по способу получения относительные показатели  всегда величины производные, определяемые в форме коэффициентов, промилле и т.п.

Показатели вариации испособы их расчета.

При изучении явлений ипроцессов общественной жизни статистика встречается с разнообразной вариацией(изменчивостью) признаков, характеризующих отдельные единицы совокупности.

/>

Величины признаковизменяются под действием различных факторов. Очевидно, что чем разнообразнееусловия, влияющие на размер данного признака, тем больше его вариация.Например, размер заработной платы рабочих зависит от нескольких факторов:специальности, разряда, стажа работы, образования, состояния здоровья и т.д.Чем больше различия между значениями факторов, тем больше вариация в уровнезаработной платы.

При характеристикеколеблемости признака используют систему абсолютных и относительныхпоказателей.

Абсолютные показателивариации:

Размах вариации R = xmax — xmin; Среднее линейное отклонение /> Дисперсия /> Среднеквадратическое отклонение />

Абсолютные показатели,кроме дисперсии, измеряются в тех же единицах, что и сам признак.

Относительные показателивариации:

Коэффициент осцилляции /> Относительное линейное отклонение /> Коэффициент вариации />

Относительные показателичаще всего выражаются в процентах

Размах колебаний, илиразмах вариации, представляет собой разность между максимальным и минимальнымзначениями признака в изучаемой совокупности:

R = xmax — xmin

Безусловным достоинствомэтого показателя является простота расчета. Однако размах вариации зависит отвеличины только крайних значений признака, поэтому область его примененияограничена достаточно однородными совокупностями. В частности, на практике оннаходит применение в предупредительном контроле качества продукции.

Точнее характеризуетвариацию признака показатель, основанный на учете колеблемости всех значенийпризнака. Поскольку средняя арифметическая является обобщающей характеристикойсвойств совокупности, большинство показателей вариации основано на рассмотренииотклонений значений признака отдельных единиц совокупности от этой величины. Ктаким показателям относятся среднее линейное отклонение, дисперсия и среднееквадратическое отклонение, представляющие собой среднюю арифметическую изотклонений индивидуальных значений признака от средней арифметической. Среднеелинейное отклонение рассчитывается из отклонений в первой степени, дисперсия исреднее квадратическое — из отклонений во второй степени. Так какалгебраическая сумма отклонений индивидуальных значений признака от среднейарифметической (согласно нулевому свойству) всегда равна нулю, то для расчетасреднего линейного отклонения используется арифметическая сумма отклонений,т.е. суммируются абсолютные значения индивидуальных отклонений значенийпризнака независимо от знака.

Среднее линейноеотклонение />вычисляетсяпо следующим формулам:

для несгруппированныхданных

/>

для сгруппированныхданных (вариационного ряда)

/>

Дисперсия /> — средняя из квадратовотклонений вариантов значений признака от их средней величины.

Дисперсия рассчитываетсяпо следующим формулам:

для несгруппированныхданных

/>

для сгруппированныхданных (вариационного ряда)

/>

Дисперсия имеет большоезначение в статистическом анализе. Однако её применение как меры вариации вряде случаев бывает не совсем удобным, потому что размерность дисперсии равнаквадрату размерности изучаемого признака. В таких случаях для измерениявариации признака вычисляют среднее квадратическое отклонение.

Среднее квадратическоеотклонение />(представляетсобой корень квадратный из дисперсии):

для несгруппированныхданных

/>

для вариационного ряда

/>

Дисперсия и среднееквадратическое отклонение недостаточно полно характеризуют колеблемостьпризнака, т.к. показывают абсолютный размер отклонений, что затрудняетсравнение изменчивости различных признаков.

Для характеристикиколеблемости явлений среднее квадратическое отклонение сопоставляется с егосредней величиной и выражают в процентах. Такой показатель называетсякоэффициентом вариации. Коэффициент вариации рассчитывается по формуле:

/>

Коэффициент вариациипредставляет собой отношение среднего квадратического отклонения к среднейарифметической.

Выражая коэффициентвариации в процентах, различные абсолютные среднеквадратические отклоненияприводят к одному основанию и дают возможность сравнивать, оцениватьколеблемость величин различных признаков. При помощи коэффициента вариациивозможно, например, сравнение размера колеблемости производительности трударабочих, занятых производством различных видов продукции, размера колеблемостиурожаев различных сельскохозяйственных культур и т.д.

Чем меньше коэффициентвариации, тем меньше колеблемость признака, и наоборот.

Относительное линейноеотклонение определяется как отношение среднего линейного отклонения к среднейарифметической в процентах:

/>

Отношение размахавариации к средней арифметической в процентах называется коэффициентомосцилляции:

/>

Самым распространеннымотносительным показателем колеблемости признака является коэффициент вариации.Он более точно, чем абсолютный, характеризует различие колеблемости признаков.

По величине коэффициентавариации можно судить о степени вариации признаков совокупности. Чем больше еговеличина, тем больше разброс значений вокруг средней, тем менее однороднасовокупность по своему составу и тем менее представительна средняя.

Коэффициент вариацииважен в тех случаях, когда нужно сравнивать средние квадратические отклонения,выраженные в разных единицах измерения.

Мода и медиана.

Мода в статистике – это величина варьирующего признака,который чаще всего встречается в данной совокупности или признак, который имеетнаибольшую частоту.

Медиана – это значение признака, которая делит рядраспределения пополам, т.е. по обе стороны этого признака будет находитьсяодинаковое единиц изучаемого признака.

Мода и медиана – это описательное–среднее. Описательныйхарактер моды и медианы связан с тем, что в них не погашаются индивидуальныеотклонения. Они всегда соответствуют определенной варианте.

Основные свойствадисперсии.

Дисперсия обладает рядомматематических свойств, использование которых значительно упрощает и облегчаетеё вычисление. Основные свойства дисперсии:

Дисперсия постоянной величины равна нулю. Если все значения признака уменьшить или увеличить на какое-то постоянное число, то дисперсия от этого не изменится. Если все значения признака уменьшить или увеличить в K раз, то дисперсия от этого соответственно увеличится или уменьшится в K2 раз. Сумма квадратов отклонений индивидуальных значений признака x от их средней />меньше суммы квадратов отклонений индивидуальных значений признака от любого данного числа a при условии, что />, т.е.

/>

Доказано,что эти две суммы отличаются на квадрат разности между />и a

/>

Этосвойство дает возможность упрощать расчеты среднего квадратического отклоненияпутем замены громоздких отклонений от любого произвольно взятого числа,удобного для проведения расчетов, с последующей поправкой.

Дисперсия признака равна разности между средним квадратом значений признака и квадратом их средней, т.е.

/>

Рассмотрим вычислениедисперсий c применением её свойств.

Один из упрощенныхспособов вычисления дисперсии основан на следующем равенстве:

/>

Этот способ исчислениядисперсии называется способом моментов или способом отсчета от условного нуля.

Дисперсияальтернативного признака. В ряде случаев возникает необходимость измерить вариациюальтернативного признака. Обозначив отсутствие интересующего признака через«0»; его наличие — через «1»; долю единиц, обладающихданным признаком — через q, исчислим среднее значение альтернативного признакаи его дисперсию.

Среднее значениеальтернативного признака равно

/>

т.к. (сумма долей единиц,обладающих и не обладающих данным признаком, равна единице).

Дисперсия альтернативногопризнака определяется следующим образом:

/>

Подставив в формулудисперсии вместо 1-p значение q=1-p, получим:

/>

Таким образом, />, т.е. дисперсияальтернативного признака равна произведению доли единиц, обладающих даннымпризнаком, и доли единиц, им не обладающих.

Правило сложениядисперсий.

На вариацию признакавлияют различные причины, факторы. Все они делятся на случайные исистематические (постоянные). Поэтому вариация может быть случайной, вызванной,вызванной действием случайных причин, и систематической, обусловленнойвоздействием постоянных факторов. В связи с этим возникает необходимость вопределении случайной и систематической вариации, их роли в общей вариации ивлияния на нее.

Как уже отмечалось, общаядисперсия характеризует общую вариацию признака под влиянием всех условий, всехпричин, вызывающих эту вариацию, и рассчитывается следующим образом:

/>; />

Для определения влиянияпостоянного фактора на величину вариации пользуются аналитической группировкой,т.е. расчленяют по нему всю совокупность на группы и определяют, какизменяется, варьируется общий результат под влиянием фактора, положенного воснование группировки.

Вариация, обусловленнаяфактором, положенным в основание группировки, называется межгрупповойвариацией.

Размеры ее определяютсяпри помощи дисперсии групповых средних.

Межгрупповая дисперсия />характеризуетколеблемость групповых или частных средних (/>i) около общей средней(xi) и исчисляется по формулам:

/>; />

где xi — средняя по каждой отдельной группе;

/> — средняя по всей совокупности;

n — число единицсовокупности;

f — частоты или веса.

Таким образом,межгрупповая дисперсия (дисперсия групповых средних) равна среднейарифметической из квадратов отклонений частных средних от общей средней.

Она характеризуетсистематическую вариацию, которая возникает под влиянием фактора признака,положенного в основу группировки.

Для определения влиянияслучайных факторов и их роли в общей вариации определяют дисперсию в пределахкаждой группы, т.е. внутригрупповую дисперсию, а затем среднюю извнутригрупповых дисперсий.

Средняя извнутригрупповых дисперсий характеризует случайную вариацию, которая возникаетпо влиянием всех факторов, кроме положенного в основание группировки.

Чтобы определить её, надорассчитать вначале внутригруппировочные дисперсии по каждой группе вотдельности, а затем среднюю их них.

Средне квадратическоеотклонение.

 Средне квадратическое отклонение(σ) и дисперсия (σ2) определяются так:

Для несгруппированных данных(первичного ряда)

  σ =/>;                    σ2 = />

длявариационного ряда

σ =/>                     σ2 =   />

формула для расчета дисперсии можетбыть преобразована:

σ2  =   />     = />    =    />    =  

  =    /> - />,

т.е.дисперсия равна средней из квадратов индивидуальных значений признака минусквадрат средней величины. Следовательно,

σ2  =   /> - />

Среднее квадратическое отклонение посвоей величине всегда превышает значение среднего линейного отклонения всоответствии со свойствами мажорантности средних.

еще рефераты
Еще работы по математике