Реферат: Автоматизированный априорный анализ статистической совокупности в среде MS Excel 3


ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т

о результатах выполнения

компьютерной лабораторной работы №1

«Автоматизированный априорный анализ статистической совокупности в среде MSExcel»

Вариант № 19

Выполнил: ст. III курса гр. БУА и А

Завьялова А.А.

Проверил: Корецкий Г.А.

Владимир 2010


Постановка задачи

При проведении статистического наблюдения за деятельностью предприятий одной из отраслей промышленности получены выборочные данные по 32-м предприятиям (выборка 10%-ная, механическая) о среднегодовой стоимости основных производственных фондов и выпуске продукции за год.

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции — как изучаемые признаки единиц.

Выборочные данные представлены в формате электронных таблиц процессора Excelв диапазоне ячеек В4: С35 (табл.1). Таблица 1

Номер предприятия Среднегодовая стоимость основных производственных фондов, млн.руб. Выпуск продукции, млн. руб.
1 1124,00 1081,50
2 1323,50 1186,50
3 1365,50 1323,00
4 1439,00 1470,00
5 935,00 735,00
6 1512,50 1260,00
7 1554,50 1701,00
8 1166,00 1155,00
9 1428,50 1354,50
10 1649,00 1690,50
11 1806,50 1785,00
13 1376,00 1407,00
14 1512,50 1533,00
15 1733,00 1858,50
16 1985,00 1995,00
17 1481,00 1344,00
18 1638,50 1596,00
19 1302,50 997,50
20 1659,50 1365,00
21 1848,50 1837,50
22 1271,00 1039,50
23 1008,50 976,50
24 1691,00 1564,50
25 1512,50 1365,00
26 1407,50 1291,50
27 1092,50 840,00
28 1470,50 1312,50
29 1701,50 1438,50
30 1617,50 1365,00
32 1187,00 1218,00

В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупности.

I .Статистический анализ выборочной совокупности

1. Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.

2. Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Me), размах вариации (R), дисперсию (σ2n ), средние отклонения — линейное ( ) и квадратическое (σn ), коэффициент вариации (), структурный коэффициент асимметрии К.Пирсона (Asn ).

3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:

а) степень колеблемости значений признаков в совокупности;

б) степень однородности совокупности по изучаемым признакам;

в) устойчивость индивидуальных значений признаков;

г) количество попаданий индивидуальных значений признаков в диапазоны:

(±σ), (±2σ), (± Зσ).

4. Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам, на основе анализа:

а) вариации признаков (исходя из оценок показателей R, , σn, );

б) количественной однородности единиц;

в) надежности (типичности) средних значений признаков;

г) симметричности распределений в центральной части ряда.

5. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Mо полученного интервального ряда и сравнить ее с показателем Mо несгруппированного ряда данных.

II . Статистический анализ генеральной совокупности

1. Рассчитать генеральную дисперсию (σ2n ), генеральное среднее квадратическое отклонение (σn ) и ожидаемый размах вариации признаков. Сопоставить значения этих

показателей для генеральной и выборочной дисперсий.

2. Для изучаемых признаков рассчитать:

а) среднюю ошибку выборки;

б) предельные ошибки выборки для уровней надежности Р=0,683, Р=0,954 и Р=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности… Сделать вывод о целесообразности использования уровня надежности Р=0,997.

3. Рассчитать коэффициенты асимметрии As и эксцесса Ек. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.

III . Экономическая интерпретация результатов статистического исследования предприятий

В этой части исследования необходимо ответить на ряд вопросов.

1. Типичны ли образующие выборку предприятия по значениям изучаемых экономических показателей?

2. Каковы наиболее характерные для предприятий значения показателей среднегодовой стоимости основных фондов и выпуска продукции?

3. Насколько сильны различия в экономических характеристиках предприятий выборочной совокупности? Можно ли утверждать, что выборка сформирована из предприятий с достаточно близкими значениями по каждому из показателей?

4. Какова структура предприятий выборочной совокупности по среднегодовой стоимости основных фондов? Каков удельный вес предприятий с наибольшими, наименьшими и типичными значениями данного показатели? Какие именно это предприятия?

5. Носит ли распределение предприятий по группам закономерный характер и какие предприятия (с более высокой или более низкой стоимостью основных фондов) преобладают в совокупности?

6. Каковы ожидаемые средние величины среднегодовой стоимости основных фондов и выпуска продукции на предприятиях корпорации в целом? Какое максимальное расхождение в значениях каждого показателя можно ожидать?

I .Статистический анализ выборочной совокупности

Задача 1

В результате визуального анализа диаграммы рассеяния признаков единиц наблюдаемой совокупности выявлены двеаномальные единицы наблюдения, номера предприятий 12,31 (Табл. 2)

Таблица 2
Аномальные единицы наблюдения
Номер предприятия Среднегодовая стоимость основных производственных фондов, млн.руб. Выпуск продукции, млн. руб.
12 620,00 1575,00
31 1985,00 525,00

Приведенные в таблице аномальные единицы наблюдения удалены из изучаемой совокупности.

Задача 2

Выборочные показатели в результате расчетов представлены в двух таблицах — таблица 3 и таблица 5. На основе этих таблиц сформирована единая Таблица 8

«Описательные статистики выборочной совокупности»

Таблица 8
Наименование показателя Среднегодовая стоимость основных производственных фондов, млн.руб." «Выпуск продукции, млн. руб. „

Среднее

1460

1369,55

Медиана Ме 1475,75

1359,75

Мода M о 1512.5

1365

Размах вариации, R 1050 1260
Минимум 935

735

Максимум 1985

1995

Уровень надежности(95,4%)

96,669

115,318

Стандартное отклонение

253,969

302,963

Дисперсия

62350,05

88726,87

Среднее линейное отклонение

200,9

229,46
Коэффициент вариации, %

17,103

21,749
Коэффициент асимметрии Asn

-0,210

0,015

Задача 3

а) степень колеблемости значений признаков в совокупности;

0%<V s 40% — колеблемость незначительная;

40%< V s 60% — колеблемость средняя (умеренная);

V s >60% — колеблемость значительная.

После удаления аномальных значений коэффициент вариации признака «Среднегодовая стоимость основных производственных фондов» составляет 17,103 %, исходя из оценочной шкалы находится в диапазоне 0%< <40%, что свидетельствует о незначительной степени колеблемости признака.

Коэффициент вариации признака «Выпуск продукции» составляет 21,749 %, исходя из оценочной шкалы находится в диапазоне 0%< <40%, что свидетельствует о незначительной степени колеблемости признака.

б) степень однородности по изучаемым признакам;

Однородность совокупности для нормального и близких к нормальному распределений устанавливается по условию ≤ 33 %..

Коэффициент вариации признака «Среднегодовая стоимость основных производственных фондов» составляет 17,103 %, что свидетельствует об однородности изучаемой совокупности.

Коэффициент вариации признака «Выпуск продукции» составляет 21,749 %, что свидетельствует об однородности изучаемой совокупности. Чем однороднее изучаемая совокупность, тем надежнее полученная средняя.

в) устойчивость индивидуальных значений признаков;

Сопоставление средних отклонений – квадратического σ и линейного позволяет сделать вывод об устойчивости индивидуальных значений признака , т.е. об отсутствии среди них «аномальных» вариантов значений.

Расчет устойчивости данных

По столбцу «Среднегодовая стоимость основных производственных фондов, млн. руб.» По столбцу «Выпуск продукции млн. рублей.
0,79 0,76

В условиях симметричного и нормального, а также близких к ним распределений между показателем σ и имеют место равенства – σ ≈ l ,25 , или ≈ 0,8 σ, поэтому отношение показателей и σ может служить индикатором устойчивости данных: если/σ (0,79столбец 1, 0,76 столбец 2 ) <0,8, значения признака устойчивы, в них не имеется «аномальных» выбросов.

г) количество попаданий индивидуальных значений признаков в диапазоны:

( ±σ), (±2σ), (± Зσ) (Таблица 9).

Таблица 9

Распределение значений признака по диапазонам рассеяния признака

Признаки Гграницы интервалов вариации признака Количество значений признака х;, находящихся в диапазоне
- σ n i < + σ n -2 σ n i < +2 σ n -3σ n i < + n
Первый признак
Второй признак

По значениям показателей и σ можно определить границы интервалов вариации признака, т.е. установить, какая доля единиц совокупности попадает в тот или иной интервал отклонений значений признака от .

Согласно вероятностной теореме П.Л.Чебышева следует ожидать, что независимо от формы распределения 75% значений признака будут находиться в интервале ±2σ, а 89% значений — в интервале ±3σ .

В нормально распределенных и близких к ним рядах вероятностные оценки границ интервалов таковы:

68,3% значений признака войдет в интервал ± σ ,

95,4% значений признака попадет в интервал ±2σ, (1)

99,7% значений признака появится в интервале ± Зσ.

Соотношение (1) известно, как правило «трех сигм».

Для выборочной совокупности значения и σ п рассчитаны и являютсяточными, поэтому, основываясь на правиле «трех сигм», можно точно оценить границы всех трех вероятностных интервалов отклонений значений признака от средней.

Ожидаемые границы вариации выборки для признака «Среднегодовая стоимость основных производственных фондов» соответствуют:

±σ с вероятностью Р=68,3%, т. е. ±253,969;

±2σ с вероятностью Р=95,4%, т. е. ±507,938;

±3σ с вероятностью Р=99,7%, т. е. ±761,907.

Ожидаемые границы вариации выборки для признака «Выпуск продукции» соответствуют:

±σ с вероятностью Р=68,3%, т. е. ±302,963;

±2σ с вероятностью Р=95,4%, т. е. ±605,926;

±3σ с вероятностью Р=99,7%, т. е. ±908,889.

Для генеральной совокупности точно известна только величина σ N , aвеличина рассчитывается, поэтому прогнозные оценки попадания значений признака в тот или иной интервал является прогнозным и обычно задается в форме (1) с учетом известного значения σN .

Ожидаемые границы вариации генеральной совокупности для признака «Среднегодовая стоимость основных производственных фондов» соответствуют:

±σ с вероятностью Р=68,3%, т. е. ±253,969;

±2σ с вероятностью Р=95,4%, т. е. ±507,938;

±3σ с вероятностью Р=99,7%, т. е. ±761,907.

Ожидаемые границы вариации генеральной совокупности для признака «Выпуск продукции» соответствуют:

±σ с вероятностью Р=68,3%, т. е. ±302,963;

±2σ с вероятностью Р=95,4%, т. е. ±605,926;

±3σ с вероятностью Р=99,7%, т. е. ±908,889.

Учитывая правило «трех сигм», в статистической практике величину Зσ считают в условиях нормального и близких к нему распределений максимально допустимой ошибкой наблюдения и отбрасывают результаты наблюдений для которых

|хi -х| > 3σ(2)

Для нормального распределения справедливо равенство

R=6σ(3)

Задача 4

Важная функция обобщающих показателей вариации , σ2, σ, — оценка надежности (типичности) средней величины.

Для «Среднегодовая стоимость основных производственных фондов» значения показателей = 200,9 , σ2 = 62350,05, σ= 253,969, = 17,103 невелики, индивидуальные значения признака ряда мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, среднее арифметическая величина является надежной характеристикой данной совокупности.

Для «Выпуск продукции» значения показателей = 229,46, σ2 = 88726,87, σ=302,963, = 21,749 невелики, индивидуальные значения признака ряда мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, среднее арифметическая величина является надежной характеристикой данной совокупности.

Задача 5

Возможность отнесения кривой распределения эмпирических данных к типу кривых нормального распределения устанавливается путем анализа формы гистограммы вариационного ряда распределения с учетом оценок показателей особенностей формы распределения (рис.2).

При анализе формы гистограммы прежде всего следует оценить распределение вариантов значений признака по интервалам (группам).Гистограмма имеет одновершинную форму, поэтому можно считать выборку однородной по данному признаку.

Установив однородность совокупности, для дальнейшего анализа формы распределения используются описательные параметры выборки. Анализируются параметры и σп, выступающие в качестве статистических оценок соответствующих параметров нормального распределения — математического ожидания М[] и стандартного отклонения σn генеральной совокупности.

Распределение приблизительно симметрично, так как параметры , Mo, Me отличаются незначительно:

= 1460 Mo= 1512,5 Me= 1475,75

Графический анализ показывает, что гистограмма приблизительно симметрична, ее «хвосты» не очень длинны, что позволяет судить о близости эмпирического распределения нормальному закону распределения.

Результаты визуального анализа не противоречат значениям полученных коэффициентов эксцесса и асимметрии, которые приведены в таблице:

Коэффициент Значение коэффициента Анализ значения коэффициента
Эксцесса

-0,345

Распределение пологое
Асимметрии

-0,153

Асимметрия низкая

Следовательно, можно сделать заключение о близости изучаемого распределения к нормальному.

II. Статистический анализ генеральной совокупности

Задача 1

Генеральные показатели , , As, Ekрассчитаны с помощью инструмента Описательная статистика и их значение представлены в табл.3. Для этих показателей сформирована отдельная таблица 10.

Таблица 10

«Описательные статистики генеральной совокупности».

Наименование показателя Среднегодовая стоимость основных производственных фондов, млн.руб.“ »Выпуск продукции, млн. руб."
Асимметричность -0.153

0,043

Эксцесс -0.345 -0.205
Дисперсия выборки

64500,052

91786,420

Стандартное отклонение σn

253,969

302,963

Дисперсия

σ2 n

\

62350,05

88726,873

Коэффициент асимметрии Asn

-0,210

0,015

Установить степень расхождения между σ2 n и , можно по формуле:

=σ2 n

Для «Среднегодовой стоимости основных производственных фондов»

64500,052 =(30/29)* 62350,05

64500,052=64500,052

Для «Выпуск продукции» значения показателей

91786,420= (30/29)* 88726,873

91786,420=91786,420

Равенство выполняется.

Ожидаемый размах вариации признаков RN :

— для первого признака R N =1050,

— для второго признака R N =1260

Соотношениемежду генеральной и выборочной дисперсиями:

— для первого признака 1,03 т.е. расхождение между дисперсиями незначительное ;

ля второго признака 1,03 т.е. расхождение между дисперсиями незначительное.

Задача 2

Значения предельных ошибок выборки имеются в табл.3, табл.4а и табл.4б. На основе этих данных сформирована таблица 11.

Таблица 11

Предельные ошибки выборки и ожидаемые границы для генеральных средних

Доверительная

вероятность Р

Коэффициент

доверия t

Предельные ошибки выборки Ожидаемые границы для средних
Для первого признака Для второго признака Для первого признака Для второго признака
0,683 1

47,212

56,320 1412,788 ≤≤ 1507,212 1313,230 ≤≤ 1425,870
0,954 2

96,669

115,318

1363,331 ≤≤ 1556,669 1254,232 ≤≤ 1484,868
0,997 3

150,205

179,182

1309,795 ≤≤ 1610,205 1190,368 ≤≤ 1548,732

Учитывая близость уровней надежности 95,4% и 99,7% и значительное расхождение соответствующих им диапазонов попадания средних .

Применения в экономических исследованиях уровня надежности 99,7% не целесообразно.

Задача 4

Значения коэффициентов асимметрии As и эксцесса Ек представлены в таблице 12.

|As |0,25 — асимметрия незначительная;

0,25<|As |0,5 — асимметрия заметная (умеренная);

|As |>0,5 — асимметрия существенная.

Таблица 12

«Среднегодовая стоимость основных фондов»
Коэффициент Значение коэффициента Анализ значения коэффициента
Эксцесса

-0,345

Распределение пологое
Асимметрия

-0,153

Асимметрия низкая
«Выпуск продукции»
Коэффициент Значение коэффициента Анализ значения коэффициента
Эксцесса -0,205 Распределение пологое
Асимметрия 0,0429 Асимметрия низкая

В данной лабораторной работе был проведен расчет статистических показателей. После группирования исходных данных по признаку «Среднегодовая стоимость основных производственных фондов» был получен ряд распределения, на основе чего была построена гистограмма.

В результате проведенного графического анализа было установлено, что полученное эмпирическое распределение близко к нормальному закону распределения. Это предположение получило подтверждение после расчета показателей коэффициента асимметрии (As) и коэффициента эксцесса (Ек).

Рассчитанное значение коэффициента As свидетельствует о том, что асимметрия распределения является незначительной, а полученное значение коэффициента Ек говорит о том, что данное распределение по сравнению с кривой нормального распределения является пологим, т. е. значения признака рассеянны от xmin до хmaх .

III . Экономическая интерпретация результатов статистического исследования предприятий

1. Типичны ли образующие выборку предприятия по значениям изучаемых экономических показателей?

Предприятия с резко выделяющимися значениями показателей приведены в табл.2. После их исключения из выборки оставшиеся 30 предприятий являются типичными по значениям изучаемых экономических показателей.

2. Каковы наиболее характерные для предприятий значения показателей среднегодовой стоимости основных производственных фондов и выпуска продукции?

Ответ на вопрос следует из анализа данных табл.9, где приведен диапазон значений признака ( ) , содержащий наиболее характерные для предприятий значения показателей.

Для среднегодовой стоимости основных производственных фондов наиболее характерные значения данного показателя находятся в пределах от 745,42млн. руб. до 1054,58млн. руб. и составляют66,6% от численности совокупности.

Для выпуска продукции наиболее характерные значения данного показа-теля находятся в пределах от 663,42 млн. руб. до 1032,27млн. руб. и составляют 63,3% от численности совокупности.

3. Насколько сильны различия в экономических характеристиках предприятий выборочной совокупности? Можно ли утверждать, что выборка сформирована из предприятий с достаточно близкими значениями по каждому из показателей?

Ответы на вопросы следуют из значения коэффициента вариации (табл.8), характеризующего степень однородности совокупности (см. вывод к задаче 3б). Максимальное расхождение в значениях показателей определяется размахом вариации R n . (табл.8).

Для среднегодовой стоимости основных производственных фондов различия в значениях показателя незначительны. Максимальное расхождение в значениях данного показателя 650.млн. руб.

Для выпуска продукции различия в значениях показателянезначительны. Максимальное расхождение в значениях данного показателя 780.млн. руб.

4. Какова структура предприятий выборочной совокупности по среднегодовой стоимости основных производственных фондов? Каков удельный вес предприятий с наибольшими, наименьшими и типичными значениями данного показатели? Какие именно это предприятия?

Структура предприятий представлена в табл.7 Рабочего файла.

Предприятия с наиболее типичными значениями показателя входят в интервал от 835млн. руб. до 965млн. руб. Их удельный вес 66,67.%. Это предприятия №№ 3,13,26,9,4,28,17,6,14,25,7.

Предприятия с наибольшими значениями показателя входят в интервал от 1095млн. руб. до 1225млн. руб. Их удельный вес 100%. Это предприятия №№ 12,21,16.

Предприятия с наименьшими значениями показателя входят в интервал от 575млн. руб. до 705.млн. руб. Их удельный вес 13,33%. Это предприятия №№ 5,23,27,1.

5. Носит ли распределение предприятий по группам закономерный характер и какие предприятия (с более высокой или более низкой стоимостью основных фондов) преобладают в совокупности?

Ответ на вопрос следует из вывода к задаче 5 и значения коэффициента асимметрии (табл.8).

Распределение предприятий на группы по среднегодовой стоимости основных производственных фондов носит закономерный характер, близкий к нормальному. В совокупности преобладают предприятия с более низкой стоимостью основных фондов.

6. Каковы ожидаемые средние величины среднегодовой стоимости основных фондов и выпуска продукции на предприятиях корпорации в целом? Какое максимальное расхождение в значениях каждого показателя можно ожидать?

Ответ на первый вопрос следует из данных табл.11. Максимальное расхождение в значениях показателя определяется величиной размаха вариации R N .

По корпорации в целом ожидаемые с вероятностью 0,954 средние величины показателей находятся в интервалах:

для среднегодовой стоимости основных производственных фондов — от 870,77млн. руб. до 929,23млн. руб.;

для выпуска продукции — от 812,96млн. руб. до 882,68млн. руб.;

Максимальные расхождения в значениях показателей:

для среднегодовой стоимости основных производственных фондов -943,32. млн. руб.;

для выпуска продукции — 1125,3млн. руб.

Приложение 1

Результативные таблицы и графики

Таблица 3
Описательные статистики
По столбцу «Среднегодовая стоимость основных производственных фондов, млн.руб.» По столбцу «Выпуск продукции, млн. руб.»
Столбец1 Столбец2
Среднее 1460 Среднее 1369,55
Стандартная ошибка 46,36811107 Стандартная ошибка 55,31317499
Медиана 1475,75 Медиана 1359,75
Мода 1512,5 Мода 1365
Стандартное отклонение 253,9686038 Стандартное отклонение 302,9627367
Дисперсия выборки 64500,05172 Дисперсия выборки 91786,41983
Эксцесс -0,344943844 Эксцесс -0,205332365
Асимметричность -0,152503649 Асимметричность 0,042954448
Интервал 1050 Интервал 1260
Минимум 935 Минимум 735
Максимум 1985 Максимум 1995
Сумма 43800 Сумма 41086,5
Счет 30 Счет 30
Уровень надежности(95,4%) 96,6687501 Уровень надежности(95,4%) 115,3175182
Таблица 4а
Предельные ошибки выборки
По столбцу «Среднегодовая стоимость основных производственных фондов, млн.руб.» По столбцу «Выпуск продукции, млн. руб.»
Столбец1 Столбец2
Уровень надежности(68,3%) 47,21227907 Уровень надежности(68,3%) 56,32019493
Таблица 4б
Предельные ошибки выборки
По столбцу «Среднегодовая стоимость основных производственных фондов, млн.руб.» По столбцу «Выпуск продукции, млн. руб.»
Столбец1 Столбец2
Уровень надежности(99,7%) 150,2053259 Уровень надежности(99,7%) 179,1820561
Таблица 5
Выборочные показатели вариации и асимметрии
По столбцу «Среднегодовая стоимость основных производственных фондов, млн.руб.» По столбцу «Выпуск продукции, млн.руб»
Стандартное отклонение 249,6999199 Стандартное отклонение 297,8705633
Дисперсия 62350,05 Дисперсия 88726,8725
Среднее линейное отклонение 200,9 Среднее линейное отклонение 229,46
Коэффициент вариации, % 17,10273424 Коэффициент вариации, % 21,74952089
Коэффициент асимметрии -0,21025237 Коэффициент асимметрии 0,015275091
Таблица 6
Карман Частота
1
1145 3
1355 5
1565 11
1775 7
1985 3
Таблица 7
Интервальный ряд распределения предприятий
по стоимости основных производственных фондов
Число предприятий по стоимости основных фондов Число предприятий в группе Накопленная частость группы
935-1145 4 13,33%
1145-1355 5 30,00%
1355-1565 11 66,67%
1565-1775 7 90,00%
17751985 3 100,00%
ИТОГО: 30 100,00%

Рис.1. Диаграмма рассеяния изучаемых признаков

Рис.2 Интегральный ряд распределения предприятий по стоимости основных фондов

еще рефераты
Еще работы по информатике