Реферат: Выборочное наблюдение

Содержание

1 Понятие о выборочном наблюдении. Преимущества выборочного метода

2 Ошибки выборки и основные способы отбора

3 Распространение выборочных данных на генеральную совокупность

4 Определение необходимой численности выборки

5 Оценка существенности расхождения выборочных средних

6 Малые выборки

Список использованной литературы


1 Понятие овыборочном наблюдении. Преимущества выборочного метода

Выборочноенаблюдение – это такой вид несплошного наблюдения, при котором характеристикавсей генеральной совокупности дается по некоторой ее части (по выборке),отобранной в случайном порядке.

Посравнению со сплошным выборочное наблюдение имеет ряд преимуществ.

Онооперативнее сплошного, так как значительно сокращает сроки проведения работ.Дает большую экономию, так как сокращает объем работы. Например, приобследовании 10% общего числа единиц совокупности объем работ сокращаетсяпримерно в 10 раз, при обследовании 5% — в 20 раз и т.д. В связи с этимпоявляется возможность расширить программу выборочного наблюдения по сравнениюсо сплошным, т.е. собирать более подробные данные по большому количествупоказателей, а отсюда – детально и всесторонне характеризовать изучаемуюсовокупность.

Обращение квыборкам обеспечивает экономию материальных, трудовых и финансовых ресурсов ивремени. Например, для составления баланса, денежных доходов и расходовнаселения, для изучения денежного обращения, выявления дифференциации населенияпо уровню жизни, определения черты бедности и т.д. необходимы данные о бюджетахсемей и одиночек. Сбор этих данных осуществляется государственной статистикой,но один статистик в состоянии курировать ежедневные записи доходов, расходов,потребления не более чем в 20-25 домохозяйствах. Если бы решили собирать данныео бюджетах всех домохозяйств, то только для этой цели (не учитывая потребностипоследующей обработки) потребовалось примерно два миллиона статистиков. Так чтоиспользование выборочного наблюдения является единственным экономическивыгодным решением этой проблемы, тем более что по результатам изучениясравнительно небольшой части (0,1% всех домохозяйств) можно получить сдостаточно высокой степенью точности данные о всей совокупности.

Подобнаяситуация возникает и при аудиторских проверках фирм, когда вместо детальногоизучения каждого платежного документа ограничиваются анализом выборкидокументов, и в других областях применения статистики.

Результатывыборочного наблюдения иногда точнее результатов сплошного, так как для егопроведения можно подобрать более квалифицированных исполнителей, лучше ихподготовить, легче организовать контроль материалов. Это повышает качествоработы, точность и достоверность статистических данных, так как при хорошейорганизации выборочного наблюдения ошибки репрезентативности могут быть меньшеошибок регистрации при сплошном наблюдении. Поэтому выборочное наблюдениеиногда используется для контроля и уточнения результатов сплошного наблюдения.

Выборочноенаблюдение применяется при невозможности провести сплошное наблюдение из-забольшого объема работ (например, при проверке качества деталей, изделий, которыевыпускаются десятками и сотнями миллионов единиц), или когда это связано суничтожением, приведением в негодность обследуемых единиц совокупности(например, при испытании электролампочек на длительность горения, крепости нитина разрыв, семян на всхожесть и т. д.)

Выборочноенаблюдение организуется так же, как и сплошное наблюдение. Кроме того, дляпроизводства выборочного наблюдения необходимо решить следующие задачи:определить, какая часть совокупности подлежит выборочному наблюдению; установить,как произвести отбор части совокупности; произвести отбор; определить, как наоснове результатов выборочного наблюдения получить необходимые характеристикивсей совокупности (распространить результаты выборки на генеральнуюсовокупность).

Преимуществавыборочного наблюдения по сравнению со сплошным возможно обеспечить, если этовыборочное наблюдение организовано и проведено в строгом соответствии снаучными принципами теории выборочного метода. Такими принципами являются:обеспечение случайности отбора единиц и достаточного их числа.

Первыйпринцип отбора – обеспечение случайности – заключается в том, что при отборекаждой из единиц изучаемой совокупности обеспечивается равная возможностьпопасть в выборку. Случайный отбор – это не беспорядочный отбор.

Второй принципотбора – обеспечение достаточного числа отобранных единиц (о нем будем говоритьпозднее).

Соблюдениеэтих принципов позволяет получить такую совокупность единиц, которая по интересующимисследователя признакам представляет всю изучаемую совокупность, т. е.является репрезентативной (представительной).

Встатистической практике общепринятыми являются следующие обозначенияхарактеристик генеральной и выборочной совокупностей.

Таблица1

Характеристикигенеральной и выборочной совокупности

Характеристики Генеральная совокупность Выборочная совокупность

1. Объем совокупности (численность единиц)

2. Доля отбора единиц в выборки (относительная численность выборки)

3. Число единиц обладающих изучаемым признаком

4. Доля единиц обладающих изучаемым признаком

5. Доля единиц, не обладающих данным значением признака

6. Средняя величина количественного признака

7. Дисперсия количественного признака

8. Дисперсия альтернативного признака

N

-

M

/>

q

/>

/>

pq

n

/>

m

/>

1-w

/>

/>

w(1-w)

 

2 Ошибкивыборки и основные виды и способы отбора

Припроведении выборочного наблюдения одной из задач является определениехарактеристик генеральной совокупности по выборочным характеристикам.Выборочные характеристики, как правило, не будут совпадать с искомыми характеристикамигенеральной совокупности, а будут отклоняться от них в ту или иную сторону.Обозначают абсолютную величину этого отклонения />, называют предельной ошибкойвыборки. Предельная ошибка выборки складывается из ошибок точности(регистрации) и ошибок репрезентативности. Под ошибками регистрации понимаютошибки, обусловленные неправильным установлением факта при наблюдении.Например, стаж работы работника была ошибочно показана на единицу меньшедействительного.

Ошибкирепрезентативности или представительностипоявляются вследствие отличия структуры выборочной совокупности от структурыгенеральной совокупности. Делятся на систематические и случайные. Систематические(тенденциозные) возникают тогда, когда нарушается основной принцип выборки,принцип ее случайности, разновозможности попадания в выборку любой единицыгенеральной совокупности. Когда преднамеренно отбираются лучшие или худшиеединицы в выборочную совокупность. С этой ошибкой можно бороться. Случайныевозникают в силу того, что структура обследуемой части (выборки) даже вусловиях научного отбора не совпадает со структурой целого (генеральнаясовокупность). Появляются эти случайные ошибки в любой выборке, как бы хорошоона ни была организована, от воли статистика не зависят. Эту случайную ошибкунужно уметь определять. Обозначается случайная (средняя) ошибка /> и представляет собойсреднюю квадратическую из всех ошибок выборки.

Предельнаяошибка выборки равна />.

Исчисляется:

– приповторном отборе по формуле

/> (1)

– прибесповторном отборе по формуле

/> (2)

/> – дисперсияпризнака, вычисленная по выборочным данным;

t – коэффициент доверия (кратности ошибкивыборки), показывающий сколько средних ошибок содержится в предельной ошибке иопределяемый по таблице интеграла вероятностей Лапласа в зависимости отзаданного уровня вероятности.

Основныезначения параметров следующие:

p t 0,683 1,0 0,954 2,0 0,997 3,0

Примечание: при t=1,0, предельная ошибка выборки /> обращается в среднюю ошибкувыборки />. />.

Разныеспособы организации выборочного наблюдения обеспечивают случайность отбора сразной степенью репрезентативности, что отражается на особенностях расчетаошибок выборки.

Основныеспособы отбора:

1. Собственно-случайныйотбор (лотерея, жеребьевка, отбор на основе таблицы случайных чисел). Онможет быть как повторным, так и бесповторным. Поэтому для расчета ошибкивыборки используются формулы (1) и (2).

2. Механическийотбор – это когда упорядоченно расположенные единицы совокупности отбираютпо одной через определенный интервал, называемый шагом выборки. Шаг выборки– величина обратная относительному объему выборки; например, при 10% — нойвыборке равен 10 (100:10), при 4%-ной – 25 (100:4) и т.д.

Механическийотбор всегда бесповторен, поэтому для расчета ошибки выборки используетсятолько формула (2).

3. Типическаявыборка обеспечивает наибольшую репрезентативность, но при этом требуетособой организации своего проведения.

Вначалегенеральная совокупность разбивается на качественно однородные группы(объединяющие единицы совокупности по типам явлений), затем из каждойвыделенной группы (выделенного типа явлений) в случайном порядке отираютсяотдельные единицы, как правило, в объеме, пропорциональном численности единицпо группам в генеральной совокупности.

Формуларасчета ошибки типического отбора

/>, (3)

где /> - средняя из внутригрупповыхдисперсий.

4. Серийная(гнездовая) выборка обеспечивает наименьшую репрезентативность, но при этомявляется самым легким, быстрым, наименее трудоемким, дешевым способоморганизации отбора. Здесь из генеральной совокупности отбирают не отдельныеединицы, а целые их группы (серии, гнезда). Внутри отобранной серии производятсплошное наблюдение.

Ошибкавыборки принимает вид:

/>, (4)

/> – число серий (гнезда) в генеральной совокупности;

/> – число серий в выборочной совокупности;

/> – межгрупповая (межсерийная)дисперсия признака.

 

3Распространение выборочных данных на генеральную совокупность

Выборочноенаблюдение проводится в целях распространения выводов, полученных по даннымвыборки, на генеральную совокупность.

Пределы, вкоторых находятся значения характеристик в генеральной совокупности призаданном уровне вероятности, следующие:

/> - длясредней; (5)

/> - для доли.  (6)

Этоозначает, что с заданной вероятностью можно утверждать, что значениегенеральной характеристики следует ожидать в этих пределах.

Покажем напримерах как определять пределы.

Пример 1. Для определения скорости расчетов с кредиторами предприятийкорпорации в коммерческом банке была проведена случайная выборка 100 платежныхдокументов, по которым средний срок перечисления и получения денег оказалсяравным 20 дням со средним квадратическим отклонением 7 дней.

Необходимос вероятностью P=0,954 определить предельную ошибку выборочной средней идоверительные пределы в которых будет находится средняя продолжительностьрасчетов предприятий данной корпорации с кредиторами.

Решение:

Средняяпродолжительность расчетов предприятий корпорации с кредиторами находится впределах

/>

Так каквыборка случайная повторная, то предельная ошибка выборки определяется поформуле (1):

/> дня.

И, значит,пределы средней продолжительности расчетов равны

/>

/>

Свероятностью 0,954 можно утверждать, что средняя продолжительность расчетовпредприятий корпорации с кредиторами в коммерческом банке может изменяться от18,6 дня до 21,4 дня.

Пример 2. Для изучения расхода сырья на единицу продукции

проведенадвухпроцентная случайная выборка, в результате которой получены следующие обобщенныеданные:

Расход сырья на единицу, г. Обследовано изделий, шт. (f)

18 – 20

20 – 22

22 – 24

24 – 26

26 и выше

5

28

52

12

3

Определить:

1)  средний расход сырья на одно изделие;

2)  дисперсию и среднее квадратическое отклонений;

3)  коэффициент вариации;

4)  с вероятностью 0,954: предельную ошибку выборочной средней ивозможные пределы расхода сырья для всей партии изделий;

5)  возможные пределы удельного веса изделий с расходом сырья от 20 до24 г.

Решение:

Всенеобходимые расчеты представим в таблице 1.

Таблица1

Расход сырья на ед.г.

Число изделий, шт., />

Середина интервала, (Х)

/>

/>

/>

/>

А 1 2 3 4 5 6

18-20

20 – 22

22 – 24

24 – 26

Свыше 26

5

28

52

12

3

19

21

23

25

27

95

588

1196

300

81

-3,6

-1,6

0,4

2,4

4,4

12,96

2,56

0,16

5,76

19,36

64,8

71,68

8,32

69,12

58,08

Итого 100 2260 272,0

Среднийрасход сырья на одно изделие в выборке равен:

/> г.

Вычислимдисперсию и среднее квадратическое отклонение.

/>

Среднееквадратическое отклонение равно корню квадратному из дисперсии

/>

Коэффициентвариации:

/> %.

Предельнаяошибка выборочной средней:

/>

Следовательно,границы генеральной средней будут находиться в пределах

/> или />

Свероятностью 0,954 можно утверждать, что расход сырья на единицу продукции всейпартии может изменяться от 22,273 до 22,927 г.

Ошибкавыборочной доли определяется по формуле:

/>

Сначала определимвыборочную долю (частость):

/> или 80 %

Выборкапоказала, что расход сырья от 20 до 24 граммов на единицу продукции приходитсяна 80% изделий. Определим предельную ошибку доли:

/> или 7.9 %

С учетомошибки генеральная доля ожидается в границах:

/> или />

Следовательно,с вероятностью 0,954 можно утверждать, что во всей партии продукции удельныйвес изделий с расходом сырья от 20 до 24 граммов ожидается в пределах не менее72,1 % и не более 87,9 %.

Пример 3. По материалам выборочного обследования 625 семей области полученыследующие данные:

Таблица3.2

Семья

Обследовано семей,

/>

Доля расходов на платные услуги, %

/>

Доля расходов на платные услуги, в коэффициентах

Дисперсия доли,

/>

1 2 3 4 5

Городских поселений

Сельской местности

500

125

37,0

24,0

0,37

0,24

0,2331

0,1824

n=625 - - -

Выборка2%-ная проведена по методу типического пропорционального отбора. В группахприменялся механических отбор семей.

Свероятностью 0,954 определить пределы доли расходов на платные услуги жителямиобласти.

Решение:

Долярасходов на платные услуги жителями области находится в пределах:

/>.

Следовательно,для решения необходимо предварительно определить среднюю долю расходов по 2группам населения, а затем ее ошибку.

Средняядоля равна:

/> или 34,4 %.

Для расчетаошибки выборки типического отбора надо вычислить среднюю из групповыхдисперсий. В графе 5 таблицы 4.2 показан расчет групповых дисперсий доли.Вычислим среднюю из них:

/>.

Теперьвычислим предельную ошибку типической выборки:

/>, 3,7%;

/> или />

Такимобразом, можно с вероятностью 0,954 утверждать, что доля расходов населения областина платные услуги ожидается в пределах не менее 30,7 % и не более 38,1 %.

Аналогичновычисляется ошибка типической выборки для выборочной средней (для варьирующегопризнака).

Пример 4. В механическом цехе завода в десяти бригадах работает 100 рабочих.В целях изучения квалификации рабочих была произведена 20% — ная серийнаябесповторная выборка, в которую вошли 2 бригады. Получено следующеераспределение обследованных рабочих по разрядам:

Рабочие Разряды рабочих в бригаде 1 Разряды рабочих в бригаде 2 Рабочие Разряды рабочих в бригаде 1 Разряды рабочих в бригаде 2

1

2

3

4

5

2

4

5

2

5

3

6

1

5

3

6

7

8

9

10

6

5

8

4

5

4

2

1

3

2

Необходимоопределить с вероятностью 0,997 пределы, в которых находится средний разрядрабочих механического цеха.

Решение:

Определимвыборочные средние по бригадам и общую среднюю:

/>

/>

/>

Определиммежсерийную дисперсию:

/>

Рассчитаемсреднюю ошибку выборки:

/>

где R-число серий в генеральной совокупности;

r-число отобранных серий.

Вычислимпредельную ошибку выборки с вероятностью 0,997

/>

Свероятностью 0,997 можно утверждать, что средний разряд рабочих механическогоцеха находится в пределах />, />.

4Определение необходимой численности выборки

В практикепроведения выборочного наблюдения возникает потребность в определениичисленности выборки, которая необходима для обеспечения определенной точностирасчета генеральных характеристик – средней и доли. Формально вопрос решаетсяпреобразованием формул для расчета ошибок выборки. Предельная ошибка выборки,вероятность ее появления и вариация признака предварительно известны. Тогданеобходимая численность выборки при заданных «/>» и «/>» будет равна:

/> - приповторном отборе. (7)

/> - прибесповторном отборе. (8)

Значениядисперсии получают из аналогичных предыдущих выборочных обследований. В случаеесли последние не производились, проводят микровыборку с единственной целью –приблизительной оценки уровня дисперсии.

Прислучайном отборе используются формулы (7) и (8), при механическом только – (8).

Длятипической выборки: />. (9)

Длясерийной выборки [1, с. 107, 108]: />. (10)

 

Пример 5. Сколько фирм необходимо проверить налоговой инспекции района,чтобы ошибка доли фирм, несвоевременно уплачивающих налоги, не превысила 5%? Поданным предыдущей проверки доля таких фирм составила 18%. Доверительнуювероятность принять равной 0,954.

Решение:

Посколькуспособ отбора не указан, расчет следует производить по формуле для повторногоотбора (7):

/> (фирм).

5 Оценкасущественности расхождения выборочных средних

К расчетамошибок случайной выборки прибегают не только для того, чтобы оценить степеньрепрезентативности выборочных данных, но и для того, чтобы сравнить между собойсредние величины данного признака по двум совокупностям.

Известно,например, что средний расход сырья на единицу продукции при существующем методепроизводства составляет 2,8 условных единиц. После внесения изменений в существующуютехнологию изготовления продукции по результатам проверки достаточно большойпартии изделий средний расход сырья на единицу продукции составил 2,6 условныеединицы. Средняя ошибка выборки оказалась равной 0,1. Возникает вопрос,действительно ли применение нового метода обработки приводит к снижению материалоемкостипродукции?

Нулеваягипотеза состоит в том, что между новым и существующим методами производстваизделий отсутствуют существенные различия с точки зрения влияния их наматериалоемкость, т.е. что между генеральными средними при старом и новомметодах производства нет существенной разницы, а отклонение выборочной среднейот достигнутого уровня при существующем методе обусловлено только случайностямивыборки, т.е. />означает, что />, где /> и /> – средний расход сырьяна единицу продукции соответственно при существующем и новом методахпроизводства.

Альтернативнаягипотеза может быть сформулирована двояко:

1.Применение нового метода обработки приводит к изменению расхода сырья наединицу продукции, т.е. /> состоит в том, что />. Примем уровеньзначимости /> равным0,05, тогда /> и критическая областьсоответственно задается неравенством />. По таблицам интегральной функцииЛапласа определяем коэффициент доверия t=1,96. Таким образом, величинапредельного расхождения двух средних с вероятностью, равной 0,95, не должнапревышать />.Следовательно, с вероятностью 0,95 доверительные пределы для генеральнойсредней при новом методе будут равны />.

Среднийрасход материала при применении новой технологии составляет 2,6, т.е. попадаетв критическую область. Следовательно, данные наблюдения не являютсясовместимыми с выдвинутой гипотезой /> о том, что между новым и существующимметодами производства изделий отсутствуют существенные различия с точки зрениявлияния их на материалоемкость.

2.Применение нового метода обработки приводит к снижению расхода сырья на единицупродукции, т.е. />/> состоит в том, что />. В этом случаерассматривается область больших отрицательных отклонений, т.е. при /> />. В данномварианте критическая область определяется неравенством />. Нулевая гипотеза не будетопровергаться, если средний расход материала на единицу продукции будет большевеличины />.Так как по новой технологии расход сырья составляет 2,6 условных единиц, то с вероятностью0,995 можно считать, что нулевая гипотеза должна быть отвергнута и что,следовательно, применение новой технологии приводит к снижению расхода сырья наизготовление продукции. [3, с. 192]

6 Малыевыборки

Выборочноенаблюдение, объем которого не превышает 20 единиц, называется малой выборкой. Кмалой выборке прибегают при проведении экспериментов в опытном хозяйстве илипри проверке качества продукции, когда это связано с порчей или уничтожением ееи в других подобных случаях. Для определения средней и предельной ошибки прималой выборке можно, это математически доказано, пользоваться теми жеформулами, что и при большой, но только с двумя особенностями.

1. Среднееквадратическое отклонение малой выборки исчисляется по формуле />.

В этойформуле сумма квадратов отклонений от средней делится не на />, а на />, т.е. на число степенейсвободы вариации.

2. Уровеньвероятности ошибки средней и доли зависит не только от коэффициента доверия/>, но и отобъема выборки />. Для количественной оценки этойзависимости английский статистик Госсет, писавший под псевдонимом Стьюдент,разработал специальную таблицу, извлечение из которой дано в табл. 1.

Таблица1

Распределениевероятностей в малых выборках

(вероятностиумножены на 1000)

/>n

t

4 5 6 7 8 9 10 15 20

1

2

3

608

760

942

626

884

960

636

908

970

644

908

976

650

914

980

654

920

938

656

924

984

666

936

992

670

940

992

Еслисравнить расхождение вероятности /> между обычной выборкой и малой (/>), то окажется,что при />,вероятность равна 0,683 и 0,670, при /> – 0,954 и 0,940 и при /> – 0,997 и0,992, т.е. по мере увеличения /> это распределение стремится к нормальному.

В явленияхобщественной жизни с их значительной вариацией при малой выборке возможныеразмеры ошибок, т.е. возможные расхождения между обобщающими показателямигенеральной и выборочной совокупности, столь значительны, что они в большоймере обесценивают результаты малой случайной выборки. Другое дело в явленияхестественных и технических, которые значительно устойчивы и характеризуютсяболее тесными связями между признаками. В этих областях малые выборки находятширокое применение. Там они и зародились и получили свое обоснование. [4, c. 299]


Список использованной литературы

 

1.  Статистика: Учеб. Пособие / А.В.Багат, М.М.Конкина, В.М.Симчера идр.; Под ред. В.М.Симчеры. – М.: Финансы и статистика, 2005. –368 с.

2.  В.М.Гусаров, Е.Н.Кузнецова. Статистика: учеб. пособие длястудентов вузов, обучающихся по экономическим специальностям – 2-е изд.,перераб. и доп. – М.: ЮНИТИ – ДАНА, 2007. – 479 с.

3.  Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики:Учебник. – М.: ИНФА – М, 1998. – 416 с.

4.  Пасхавер Н.С., Яблочник А.Л. Общая теория статистики: Дляпрограммированного обучения. Учеб. Пособие / Под ред. проф. М.М.Юзбашева. – 2-еизд. перераб. и доп. – М: Финансы и статистика, 1983. – 432 с.

еще рефераты
Еще работы по математике