Генеральна сукупність являє собою. Генеральна і вибіркова сукупності. Метод вибірки. Середня арифметичні значеніяXі У :, в контрольній групі

Генеральна сукупність - сукупність всіх об'єктів (одиниць), щодо яких учений має намір робити висновки при вивченні конкретної проблеми. Генеральна сукупність складається з усіх об'єктів, які підлягають вивченню. Склад генеральної сукупності залежить від цілей дослідження. Іноді генеральна сукупність - це все населення певного регіону (наприклад, коли вивчається ставлення потенційних виборців до кандидата), найчастіше задається кілька критеріїв, що визначають об'єкт дослідження. Наприклад, жінки 18-29 років, які використовують крем для рук певних марок не рідше разу на тиждень, і мають дохід не нижче $ 150 на одного члена сім'ї.

вибірка - безліч випадків (випробовуваних, об'єктів, подій, зразків), за допомогою певної процедури вибраних з генеральної сукупності для участі в дослідженні.

  1. Обсяг вибірки;
  2. Залежні і незалежні вибірки;
  3. репрезентативність:
    1. Приклад репрезентативної вибірки;
  4. Види плану побудови груп з вибірок;
  5. Стратегії побудови груп:
    1. рандомизация;
    2. Попарний відбір;
    3. Стратометріческая відбір;
    4. Наближене моделювання.

обсяг вибірки - число випадків, включених до вибіркової сукупності. З статистичних міркувань рекомендується, щоб число випадків складало не менше 30-35.

Залежні і незалежні вибірки

При порівнянні двох (і більше) вибірок важливим параметром є їх залежність. Якщо можна встановити гомоморфності пару (тобто, коли одному випадку з вибірки X сооветствует один і тільки один випадок з вибірки Y і навпаки) для кожного випадку в двох вибірках (і це підстава взаємозв'язку є важливим для вимірюваного на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок: пари близнюків, два виміри якої-небудь ознаки до і після експериментального впливу, чоловіки і дружини і т. П.

У разі, якщо такий взаємозв'язок між вибірками відсутня, то ці вибірки вважаються незалежними, наприклад: чоловіки і жінки, психологи і математики.

Відповідно, залежні вибірки завжди мають однаковий обсяг, а обсяг незалежних може відрізнятися.

Порівняння вибірок проводиться за допомогою різних статистичних критеріїв:

  • t-критерій Стьюдента;
  • T-критерій Вілкоксона;
  • U-критерій Манна-Уїтні;
  • Критерій знаків і ін.

репрезентативність

Вибірка може розглядатися в якості репрезентативної або репрезентативної.

Приклад репрезентативної вибірки

У США одним з найбільш відомих історичних прикладів репрезентативної вибірки вважається випадок, що стався під час президентських виборів в 1936 році Журнал «Літрері Дайджест», успішно прогнозував події кількох попередніх виборів, помилився у своїх прогнозах, розіславши десять мільйонів пробних бюлетенів своїм передплатникам, людям, обраним по телефонних книг всієї країни, і людям з реєстраційних списків автомобілів. У 25% повернулися бюлетенів (майже 2,5 мільйона) голоси були розподілені наступним чином:

57% віддавали перевагу кандидатові-республіканцеві Альфу Лендону

40% вибрали чинного на той час президента-демократа Франкліна Рузвельта

На дійсних же виборах, як відомо, переміг Рузвельт, набравши понад 60% голосів. Помилка «Літрері Дайджест» полягала в наступному: бажаючи збільшити репрезентативність вибірки, - так як їм було відомо, що більшість їх передплатників вважають себе республіканцями, - вони розширили вибірку за рахунок людей, вибраних з телефонних книг і реєстраційних списків. Однак вони не врахували сучасних їм реалій і в дійсності набрали ще більше республіканців: під час Великої депресії володіти телефонами і автомобілями могли собі дозволити в основному представники середнього і верхнього класу (тобто більшість республіканців, а не демократів).

Види плану побудови груп з вибірок

Виділяють кілька основних видів плану побудови груп:

  1. Дослідження з експериментальною і контрольною групами, які ставляться в різні умови;
  2. Дослідження з експериментальною і контрольною групами із залученням стратегії попарного відбору;
  3. Дослідження з використанням тільки однієї групи - експериментальної;
  4. Дослідження з використанням змішаного (факторного) плану - все групи ставляться в різні умови.

Стратегії побудови груп

Відбір груп для їх участі в психологічному експерименті здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої і зовнішньої валідності:

  1. Рандомизация (випадковий відбір);
  2. Попарний відбір;
  3. Стратометріческая відбір;
  4. Наближене моделювання;
  5. Залучення реальних груп.

рандомизация

Рандомизация, або випадковий відбір, використовується для створення простих випадкових вибірок. Використання такої вибірки грунтується на припущенні, що кожен член популяції з однаковою ймовірністю може потрапити до вибірки. Наприклад, щоб зробити випадкову вибірку з 100 студентів вузу, можна скласти папірці з іменами всіх студентів вузу в капелюх, а потім дістати з неї 100 папірців - це буде випадковим відбором

попарний відбір

Попарний відбір - стратегія побудови груп вибірки, при якому групи випробовуваних складаються із суб'єктів, еквівалентних по значущим для експерименту побічним параметрам. Дана стратегія ефективна для експериментів з використанням експериментальних і контрольних груп з кращим варіантом - залученням блізнецових пар (моно- і дизиготних), так як дозволяє створити.

стратометріческая відбір

Стратометріческая відбір - рандомізація з виділенням страт (або кластерів). При даному способі формування вибірки генеральна сукупність ділиться на групи (страти), що володіють певними характеристиками (стать, вік, політичні уподобання, освіта, рівень доходів тощо.), І відбираються випробовувані з відповідними характеристиками.

наближене моделювання

Наближене моделювання - складання обмежених вибірок і узагальнення висновків про цю вибірці на ширшу популяцію. Наприклад, за участю в дослідженні студентів 2-го курсу університету, дані цього дослідження поширюються на «людей у \u200b\u200bвіці від 17 до 21 року». Допустимість подібних узагальнень вкрай обмежена.

Отже, закономірності, яким підкоряється досліджувана випадкова величина, фізично повністю обумовлюються реальним комплексом умов її спостереження (або експерименту), а математично задаються відповідним імовірнісним простором або, що те ж, відповідним законом розподілу ймовірностей. Однак при проведенні статистичних досліджень кілька зручнішою виявляється інша термінологія, пов'язана з поняттям генеральної сукупності.

Генеральною сукупністю називають сукупність всіх мислимих спостережень (або всіх подумки можливих об'єктів цікавить нас типу, з яких «знімаються» спостереження), які могли б бути зроблені при цьому реальному комплексі умов. Оскільки у визначенні мова йде про всіх подумки можливих спостереженнях (або об'єктах), то поняття генеральної сукупності є поняття умовно-математичне, абстрактне і його не слід змішувати з реальними сумами, що підлягають статистичному дослідженню. Так, провівши обстеження навіть всі підприємства підгалузі з точки зору реєстрації значень характеризують їх техніко-економічних показників, ми можемо розглядати обстежених сукупність лише як представника гіпотетично можливої \u200b\u200bширшої сукупності підприємств, які могли б функціонувати в рамках того ж самого реального комплексу умов

У практичній роботі зручніше вибір пов'язувати з об'єктами спостереження, ніж з характеристиками цих об'єктів. Ми відбираємо для вивчення машини, геологічні проби, людей, але не значення характеристик машин, проб, людей. З іншого боку, в математичної теорії об'єкти і сукупність їх характеристик не розрізняються і подвійність введеного визначення зникає.

Як бачимо, математичне поняття «генеральна сукупність» фізично повністю обумовлюється, так само як і поняття «імовірнісний простір», «випадкова величина» і «закон розподілу ймовірностей», відповідним реальним комплексом умов, а тому всі ці чотири математичних поняття можна вважати в певному сенсі синонімами. Генеральна сукупність називається кінцевої або нескінченної в залежності від того, кінцева або нескінченна сукупність всіх мислимих спостережень.

З визначення випливає, що безперервні генеральні сукупності (що складаються з спостережень ознак безперервної природи) завжди нескінченні. Дискретні ж генеральні сукупності можуть бути як нескінченними, так і кінцевими. Скажімо, якщо аналізується партія з N виробів на сортність (див. Приклад в п. 4.1.3), коли кожен виріб може бути віднесено до одного з чотирьох сортів, досліджуваної випадкової величиною є номер сорту випадково витягнутого з партії вироби, а безліч можливих значень випадкової величини складається відповідно з чотирьох точок (1, 2, 3 і 4) то, очевидно, генеральна сукупність буде кінцевою (всього N мислимих спостережень).

Поняття нескінченної генеральної сукупності є математична абстракція, як і уявлення про те, що вимір випадкової величини можна повторити нескінченне число разів. Наближено нескінченну генеральну сукупність можна тлумачити як граничний випадок кінцевої, коли число об'єктів, що породжуються даними реальним комплексом умов, необмежено зростає. Так, якщо в тільки що наведеному прикладі замість партій виробів розглядати безперервне масове виробництво тих же виробів, то ми і прийдемо до поняття нескінченної генеральної сукупності. Практично ж така видозміна рівносильно вимогу

Вибірка з даної генеральної сукупності - це результати обмеженого ряду спостережень випадкової величини. Вибірку можна розглядати як якийсь емпіричний аналог генеральної сукупності, то, з чим ми найчастіше на практиці маємо справу, оскільки обстеження всієї генеральної сукупності буває або дуже трудомістким (в разі великих N), або принципово неможливо (в разі нескінченних генеральнихсукупностей).

Число спостережень, що утворюють вибірку, називають обсягом вибірки.

Якщо обсяг вибірки великий і при цьому ми маємо справу з одновимірної безперервної величиною (або з одновимірної дискретної, число можливих значень якої досить велике, скажімо більше 10), то часто зручніше, з точки зору спрощення подальшої статистичної обробки результатів спостережень, перейти до так званим «групованим» вибірковими даними. Цей перехід здійснюється звичайно в такий спосіб:

а) відзначаються найменше та найбільше значення у вибірці;

б) весь обстежений діапазон розбивається на певну кількість 5 рівних інтервалів групування; при цьому кількість інтервалів s не повинно бути менше 8-10 і більше 20-25: вибір кількості інтервалів істотно залежить від обсягу вибірки для приблизної орієнтації у виборі 5 можна користуватися наближеною формулою

яку слід сприймати радше як оцінку знизу для s (особливо при великих

в) відзначаються крайні точки кожного з інтервалів в порядку зростання, а також їх середини

г) підраховуються числа вибіркових даних, які потрапили в кожен з інтервалів: (очевидно,); вибіркові дані, що потрапили на межі інтервалів, або рівномірно розподіляються по двом сусіднім інтервалах, або домовляються відносити їх тільки до якогось одного з них, наприклад до лівого.

Залежно від конкретного змісту завдання в цю схему групування можуть бути внесені деякі видозміни (наприклад, в деяких випадках доцільно відмовитися від вимоги рівної довжини інтервалів групування).

У всіх подальших міркуваннях, що використовують вибіркові дані, будемо виходити з тільки що описаної системи позначень.

Нагадаємо, що сутність статистичних методів полягає в тому, щоб за деякою частини генеральної сукупності (тобто по вибірці) виносити судження про її властивості в цілому.

Один з найважливіших питань, від успішного вирішення якого залежить достовірність отриманих в результаті статистичної обробки даних висновків, є питання репрезентативності вибірки, тобто питання повноти і адекватності уявлення нею цікавлять нас властивостей аналізованої генеральної сукупності. У практичній роботі одна і та ж група об'єктів, взятих для вивчення, може розглядатися як вибірка з різних генеральних сукупностей. Так, групу сімей, навмання відібраних з кооперативних будинків однієї з житлово-експлуатаційних контор (ЖЕК) одного з районів міста для детального соціологічного обстеження, можна розглядати і як вибірку з генеральної сукупності сімей (з кооперативної формою житла) даної ЖЕК, і як вибірку з генеральної сукупності сімей даного району, і як вибірку з генеральної сукупності всіх сімей міста, і, нарешті, як вибірку з генеральної сукупності всіх сімей міста, що проживають в кооперативних будинках. Змістовна інтерпретація результатів апробації істотно залежить від того, представником якої генеральної сукупності ми розглядаємо відібрану групу сімей, для якої генеральної сукупності цю вибірку можна вважати представницької (репрезентативною). Відповідь на це питання залежить від багатьох факторів. У наведеному вище прикладі, зокрема, від наявності або відсутності спеціального (можливо, прихованого) фактора, що визначає належність родини до даної ЖЕК або району в цілому (таким фактором може бути, наприклад, середньодушовий дохід сім'ї, географічне розташування району в місті, « вік »району і т. п.).


Лекція 6. Елементи математичної статистики

Питання для контролю знань і підбиття підсумку прочитаної лекції

1. Дайте визначення випадкової величини.

2.Напишіть формули для математичного очікування і дисперсії дискретної і безперервної випадкових величин.

3. Дайте визначення локальної інтегральної гранична теорем Лапласа

4. Напишіть формули, що задають біноміальний розподіл, гипергеометрическое розподіл, розподіл Пуассона, рівномірний розподіл і нормальний розподіл.

Мета: Вивчити основні поняття математичної статистики

1. Генеральна сукупність і вибірка

2. Статистичний розподіл вибірки. Полігон. Гістограма .

3. Оцінки параметрів генеральної сукупності за її вибірці

4. Генеральна і вибіркова середні. Методи їх розрахунку.

5. Генеральна і вибіркова дисперсії.

6. Питання для контролю знань і підбиття підсумку прочитаної лекції

Ми приступаємо до вивчення елементів математичної статистики, в якій розробляються науково обґрунтовані методи збору статистичних даних та їх обробки.

1. Генеральна сукупність і вибірка.Нехай потрібно вивчити безліч однорідних об'єктів (це множина називається статистичною сукупністю)щодо деякого якісного або кількісного ознаки, що характеризує ці об'єкти. Наприклад, якщо є партія деталей, то якісною ознакою може служити стандартність деталі, а кількісним - контрольований розмір деталі.

Найкраще зробити суцільне обстеження, тобто вивчити кожен об'єкт. Однак в більшості випадків з різних причин це зробити неможливо. Перешкоджати суцільного обстеження може велике число об'єктів, недоступність їх. Якщо, наприклад, потрібно знати середню глибину воронки при вибуху снаряда з дослідної партії, то, виробляючи суцільне обстеження, ми знищимо всю партію.

Якщо суцільне обстеження неможливо, то з усієї сукупності вибирають для вивчення частину об'єктів.

Статистична сукупність, з якої відбирають частину об'єктів, називається генеральною сукупністю.Безліч об'єктів, випадково відібраних з генеральної сукупності, називають вибіркою.

Число об'єктів генеральної сукупності і вибірки називають відповідно об'ємомгенеральної сукупності і об'ємомвибірки.

Приклад 10.1.Плоди одного дерева (200 шт.) Обстежують на наявність специфічного для даного сорту смаку. Для цього відбирають 10 шт. Тут 200 - обсяг генеральної сукупності, а 10 - обсяг вибірки.

Якщо вибірку відбирають по одному об'єкту, який обстежують і знову повертають в генеральну сукупність, то вибірка називається повторної.Якщо об'єкти вибірки вже не повертаються в генеральну сукупність, то вибірка називається бесповторной.



На практиці частіше використовується бесповторная вибірка. Якщо обсяг вибірки складає невелику частку обсягу генеральної сукупності, то різниця між повторної і бесповторной вибірками незначна.

Властивості об'єктів вибірки повинні правильно відображати властивості об'єктів генеральної сукупності, або, як кажуть, вибірка повинна бути репрезентативною(Представницької). Вважається, що вибірка репрезентативна, якщо всі об'єкти генеральної сукупності мають однакову ймовірність потрапити до вибірки, т. Е. Вибір проводиться випадково. Наприклад, для того щоб оцінити майбутній урожай, можна зробити вибірку з генеральної сукупності ще не дозрілих плодів і досліджувати їх характеристики (масу, якість та ін.). Якщо вся вибірка буде зроблена з одного дерева, то вона не буде репрезентативною. Репрезентативна вибірка повинна складатися з випадково обраних плоду зо випадково обраних дерев.

2. Статистичний розподіл вибірки. Полігон. Гістограма.Нехай з генеральної сукупності витягнута вибірка, причому х 1 спостерігалося n 1 раз, х 2 - п 2раз, ..., х k - n k раз і n 1 +n 2 +…+ п k= п -обсяг вибірки. спостережувані значення x 1 , x 2 , …, x k називають варіантами,а послідовність варіант, записана в порядку зростання, - варіаційним рядом.числа спостережень n 1 , n 2 , …, n kназивають частотами,а їх відносини до обсягу вибірки,, ..., - відносними частотами.Відзначимо, що сума відносних частот дорівнює одиниці:.

Статистичним розподілом вибіркиназивають перелік варіант і відповідних їм частот або відносних частот. Статистичний розподіл можна задати також у вигляді послідовності інтервалів і відповідних їм частот (безперервне розподіл). Як частоти, що відповідає інтервалу, беруть суму частот варіант, які потрапили в цей інтервал. для графічного зображення статистичного розподілу використовують полігониі гістограми.

Для побудови полігону на осі Охвідкладають значення варіант х i, на осі Оу -значення частот п i (відносних частот).

Приклад 10.2.На рис. 10.1 показаний полігон наступного розподілу

Полігоном зазвичай користуються в разі невеликого числа варіант. У разі великого числа варіант і в разі безперервного розподілу ознаки частіше будують гістограми. Для цього інтервал, в якому укладені всі спостережувані значення ознаки, розбивають на декілька часткових інтервалів довжиною h і знаходять для кожного часткового інтервалу п i, - суму частот варіант, які потрапили в i-інтервал. Потім на цих інтервалах, як на підставах, будують прямокутники з висотами (або, де п -обсяг вибірки).

Площа iчасткового прямокутника дорівнює , (або ).

Отже, площа гістограми дорівнює сумі всіх частот (або відносних частот), тобто обсягом вибірки (або одиниці).

Приклад 10.3.На рис. 10.2 показана гістограма безперервного розподілу обсягу n \u003d 100, наведеного в таблиці нижче.

Поняття репрезентативності. Концептуальний об'єкт і генеральна сукупність. Проектований об'єкт. Проектована і реальна генеральна сукупності.

Ми знаємо, що соціологічна наука має справу не з текучої безпосередністю життя, а з даними, організованими за певними правилами в просторі ознак. Під даними маються на увазі значення змінних, приписані одиницям дослідження - об'єктам. Ці об'єкти - спільноти, інституції, люди, тексти, речі - утворюють в просторі ознак різноманітні і нерідко химерні конфігурації, даючи досліднику можливість висловлювати узагальнюючі судження про дійсність.

Як тільки мова заходить про дійсність, виявляється, що отримані дані відносяться, строго кажучи, тільки до реєстраційних документів (анкет, бланків інтерв'ю, протоколам спостереження і т. П.). Немає ніяких гарантій, що дійсність за вікнами лабораторії (скажімо, по ту сторону шкал) не опиниться інший. До вибіркової процедури ми ще не дійшли, але вже постає питання про репрезентативність даних: чи можна поширити відомості, отримані в процесі обстеження, на об'єкти, що знаходяться за межами нашого конкретного досвіду? Відповідь однозначна: можна. В іншому випадку наші спостереження не виходили б за рамки «Здес-тепер-сукупності». Вони ставилися б не до москвичів, а до тих, хто тільки що був опитаний по телефону в Москві; ні до читачам газети «Тиждень», а до тих, хто надіслав до редакції поштою заповнений відривний купон. Після завершення опитування ми зобов'язані вважати, що і «москвичі», і «читачі» залишилися колишніми. Ми віримо в стабільність світу тому, що наукові спостереження виявляють дивовижне сталість.

Будь-яке одиничне спостереження поширюється на більш широку сферу спостережень, і проблема репрезентації полягає в тому, щоб встановити ступінь відповідності між параметрами обстеженої сукупності і «реальними» характеристиками об'єкта. Вибіркова процедура призначена якраз для того, щоб реконструювати реальний об'єкт дослідження і генеральну сукупність з окремих моментних спостережень.

Поняття вибіркової репрезентативності близьке до поняття зовнішньої валідності; тільки в першому випадку проводиться екстраполяція однієї і тієї ж характеристики на більш широку сукупність одиниць, а в другому - перехід з одного смислового контексту в інший. Вибіркова процедура здійснюється кожною людиною тисячу разів на день, при цьому ніхто особливо не замислюється над репрезентативністю спостережень. Досвід замінює калькуляцію. Щоб дізнатися, чи добре посолена каша, зовсім не обов'язково з'їдати всю каструлю - тут більш ефективні методи неруйнівного контролю, в тому числі вибіркова перевірка: потрібно спробувати одну ложечку. При цьому треба бути впевненим, що каша добре перемішана. Якщо каша перемішана погано, має сенс провести не один завмер, а серію, т. Е. Спробувати в різних місцях каструлі - це вже вибірка. Складніше переконатися в тому, що відповідь студента на іспиті репрезентує його знання, а не є випадковою удачею або невдачею. Для цього і задаються кілька питань. Передбачається, що, якби студент відповів на всі можливі питання по предмету, результат був би «істинний», т. Е. Відображав реальні знання. Але тоді ніхто не зміг би витримати іспит.



У підставі вибіркової процедури завжди лежить «якби» - припущення про те, що екстраполяція спостережень Существеннон змінить отриманий результат. Тому генеральну сукупність можна визначити як «об'єктивну можливість» вибіркової сукупності.

Проблема дещо ускладнюється, якщо розібратися в тому, що мається на увазі під об'єктом дослідження. Вивчивши досить численну сукупність людей, соціолог приходить до висновку, що змінна «радикалізм-консерватизм» позитивно корелює з віком: зокрема, старші покоління виявляють швидше консервативність, ніж революційність. Але обстежений об'єкт - вибіркова сукупність - не існує в реальності як такої. Він сконструйований процедурою відбору респондентів і проведення інтерв'ю, а потім відразу ж зникає, розчиняється в масиві. Дійсно, вибіркова сукупність, з якої безпосередньо «знімаються» дані, породжується процедурою, але в той же час вона розчинена в великий сукупності, яку представляє або репрезентує з різним ступенем точності і надійності. Соціологічні укладення відносяться не до обстеженим минулого тижня респондентам, а до ідеалізованим об'єктам: «старшим поколінням», «молоді», тим, хто виявляє «радикалізм» або «консерватизм». Йдеться про категоріальних узагальненнях, необмежених просторово-часовими обставинами. В цьому відношенні вибіркова процедура допомагає звільнитися від спостережень і перейти в світ ідей.

Таким чином, у нас є можливість провести розмежування об'єкта дослідження і генеральної сукупності: об'єкт - не просто сукупність одиниць, а поняття, відповідно до якого здійснюється ідентифікація і відбір одиниць дослідження. В цьому відношенні справедливо гегелівське припис вважати істинним тільки те буття, яке відповідає своєму поняттю. Теоретично обсяг поняття, яке означає об'єкт дослідження, повинен відповідати обсягу генеральної сукупності. Однак таке відповідність досягається вкрай рідко.

Нам знадобиться поняття концептуального об'єкта -ідеального конструкту, що позначає рамки теми. «Росіяни», «аудиторія центральних газет», «електорат», «демократична громадськість» - такі типові об'єкти дослідницького інтересу соціологів. Безсумнівно, концептуального об'єкта повинна відповідати цілком реальна генеральна сукупність. Для цього необхідно передбачити ще один об'єкт дослідження - проектується.Проектований об'єкт - це сукупність доступних досліднику одиниць. Завдання полягає в тому, щоб встановити групи, які є недоступними або важкодоступними для збору даних.

Очевидно, що обстежити об'єкт, що позначається як «росіяни», практично неможливо. Серед росіян чимало людей знаходиться в тюрмах, виправно-трудових установах, в слідчих ізоляторах та інших важкодоступних для інтерв'юера місцях. Цю групу доведеться «відняти» з проектованого об'єкта. «Відняти» доведеться і багатьох пацієнтів психіатричних лікарень, дітей, частина людей похилого віку. Навряд чи цивільному соціологу вдасться забезпечити нормальні шанси на потрапляння до вибірки і військовослужбовцям. Аналогічні проблеми супроводжують обстеження читачів, виборців, жителів малих міст, відвідувачів театрів.

Перераховані труднощі - лише мала частина тих, найчастіше непереборних перешкод, з якими стикається соціолог на польовий стадії дослідження. Спеціаліст повинен передбачити ці труднощі і не тішити себе ілюзіями з приводу повної реалізації проектованого об'єкта. В іншому випадку його чекають розчарування.

Отже, об'єкт дослідження не збігається з генеральною сукупністю приблизно так само, як карта місцевості не збігається з самою місцевістю.

Довго думали-гадали, Генерали все писали на великому аркуші. Було гладко на папері, та забули про яри, А по ним ходити, -

ці слова з старовинної солдатської пісні цілком можна застосувати до проектування вибірки, якщо врахувати, що ходити доведеться по квартирах.

Безсумнівно, генеральна сукупність - це та сукупність, з якої виробляється вибірка одиниць. Однак так тільки здається. Вибірка виробляється з тієї сукупності, з якої виконується фактичне відбір респондентів. назвемо її реальної.Відмінності між проектованої і реальної сумами можна побачити на власні очі, порівнявши списки «проектованих» респондентів і опитаних фактично.

Реальний об'єкт - та сукупність, яка сформувалася на стадії польового дослідження з урахуванням обмежень в доступності первинної соціологічної інформації. Крім ув'язнених, військовослужбовців і хворих, меншу ймовірність потрапити до вибірки мають жителі віддалених від транспортних комунікацій сіл, особливо якщо обстеження проводиться восени; ті, кого, як правило, немає вдома, не схильні до розмов зі сторонніми людьми і т. п. Буває, що інтерв'юери, користуючись відсутністю контролю, нехтують точним виконанням своїх обов'язків і опитують не тих, кого належить опитувати по інструкції, а тих, кого легше «дістати». Наприклад, відвідувати квартири респондентів інтерв'юерам наказано вечорами, коли легше застати їх вдома. Якщо дослідження проводиться, припустимо, в листопаді, то вже о п'ятій годині вечора в середній смузі Росії на вулиці зовсім темно. У багатьох містах таблички з назвами вулиць і номерами будинків зустрічаються не часто. Якщо обов'язки інтерв'юерів виконують студентки місцевого педінституту, можна уявити ступінь відхилення реального об'єкта від проектованого. Іноді дослідники надходять ще простіше: заповнюють анкети самі. Ці труднощі є одним з джерел так званих систематичних помилок вибірки.

існують досить ефективні способи контролю заповнення анкет і прийоми ремонту вибірки, зокрема «зважування» основних типологічних груп респондентів: групи тих, кого не вистачає, збільшуються, а надлишкові групи зменшуються. Так реальний масив підганяється під проектований і це цілком виправдано.

Генеральна сукупність (В англ. - population) - сукупність всіх об'єктів (одиниць), щодо яких учений має намір робити висновки при вивченні конкретної проблеми.

Генеральна сукупність складається з усіх об'єктів, які підлягають вивченню. Склад генеральної сукупності залежить від цілей дослідження. Іноді генеральна сукупність - це все населення певного регіону (наприклад, коли вивчається ставлення потенційних виборців до кандидата), найчастіше задається кілька критеріїв, що визначають об'єкт дослідження. Наприклад, чоловіки 30-50 років, які використовують бритву певної марки не рідше разу на тиждень, і мають дохід не нижче $ 100 на одного члена сім'ї.

вибірка або вибіркова сукупність - безліч випадків (випробовуваних, об'єктів, подій, зразків), за допомогою певної процедури вибраних з генеральної сукупності для участі в дослідженні.

Характеристики вибірки:

· Якісна характеристика вибірки - кого саме ми вибираємо і які способи побудови вибірки ми для цього використовуємо.

· Кількісна характеристика вибірки - скільки випадків вибираємо, іншими словами обсяг вибірки.

необхідність вибірки

· Об'єкт дослідження дуже великий. Наприклад, споживачі продукції глобальної компанії - величезна кількість територіально розкиданих ринків.

· Існує необхідність в зборі первинної інформації.

обсяг вибірки

обсяг вибірки - число випадків, включених до вибіркової сукупності. З статистичних міркувань рекомендується, щоб число випадків складало не менше 30 - 35.

Залежні і незалежні вибірки

При порівнянні двох (і більше) вибірок важливим параметром є їх залежність. Якщо можна встановити гомоморфності пару (тобто, коли одному випадку з вибірки X відповідає один і тільки один випадок з вибірки Y і навпаки) для кожного випадку в двох вибірках (і це підстава взаємозв'язку є важливим для вимірюваного на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок:

· пари близнюків,

· два виміри якої-небудь ознаки до і після експериментального впливу,

· чоловіки і дружини

· і т.п.

У разі, якщо такий взаємозв'язок між вибірками відсутня, то ці вибірки вважаються незалежними, Наприклад:

· чоловіки та жінки,

· психологи і математики.

Відповідно, залежні вибірки завжди мають однаковий обсяг, а обсяг незалежних може відрізнятися.

Порівняння вибірок проводиться за допомогою різних статистичних критеріїв:

· t-критерій Стьюдента

· критерій Уилкоксона

· U-критерій Манна-Уїтні

· критерій знаків

· та ін.

репрезентативність

Вибірка може розглядатися в якості репрезентативної або репрезентативної.

Приклад репрезентативної вибірки

У США одним з найбільш відомих історичних прикладів репрезентативної вибірки вважається випадок, що стався під час президентських виборів в 1936 році. Журнал «Літрері Дайджест», успішно прогнозував події кількох попередніх виборів, помилився у своїх прогнозах, розіславши десять мільйонів пробних бюлетенів своїм передплатникам, а також людям, обраним за телефонним книгам всієї країни і людям з реєстраційних списків автомобілів. У 25% повернулися бюлетенів (майже 2,5 мільйона) голоси були розподілені наступним чином:

· 57% віддавали перевагу кандидатові-республіканцеві Альфу Лендону

· 40% вибрали чинного на той час президента-демократа Франкліна Рузвельта

На дійсних же виборах, як відомо, переміг Рузвельт, набравши понад 60% голосів. Помилка «Літрері Дайджест» полягала в наступному: бажаючи збільшити репрезентативність вибірки, - так як їм було відомо, що більшість їх передплатників вважають себе республіканцями, - вони розширили вибірку за рахунок людей, вибраних з телефонних книг і реєстраційних списків. Однак вони не врахували сучасних їм реалій і в дійсності набрали ще більше республіканців: під час Великої депресії володіти телефонами і автомобілями могли собі дозволити в основному представники середнього і вищого класу (тобто більшість республіканців, а не демократів).

Види плану побудови груп з вибірок

Виділяють кілька основних видів плану побудови груп:

1. Дослідження з експериментальною і контрольною групами, які ставляться в різні умови.

2. Дослідження з експериментальною і контрольною групами із залученням стратегії попарного відбору

3. Дослідження з використанням тільки однієї групи - експериментальної.

4. Дослідження з використанням змішаного (факторного) плану - все групи ставляться в різні умови.

типи вибірки

Вибірки діляться на два типи:

· імовірнісні

· невероятностной

імовірнісні вибірки

1. Проста імовірнісна вибірка:

oПроста повторна вибірка. Використання такої вибірки грунтується на припущенні, що кожен респондент з рівною часткою ймовірності може потрапити до вибірки. На основі списку генеральної сукупності складаються картки з номерами респондентів. Вони поміщаються в колоду, перемішуються і з них навмання виймається картка, записується номер, потім повертається назад. Далі процедура повторюється стільки раз, який обсяг вибірки нам необхідний. Мінус: повторення одиниць відбору.

Процедура побудови простої випадкової вибірки включає в себе наступні кроки:

1. необхідно отримати повний список членів генеральної сукупності і пронумерувати цей список. Такий список, нагадаємо, називається основою вибірки;

2. визначити передбачуваний обсяг вибірки, тобто очікуване число опитаних;

3. витягти з таблиці випадкових чисел стільки чисел, скільки нам потрібно вибіркових одиниць. Якщо у вибірці має виявитися 100 осіб, з таблиці беруть 100 випадкових чисел. Ці випадкові числа можуть генеруватися комп'ютерною програмою.

4. вибрати зі списку-основи ті спостереження, номери яких відповідають виписаним випадковим числах

· Проста випадкова вибірка має очевидні переваги. Цей метод вкрай простий для розуміння. Результати дослідження можна поширювати на досліджувану сукупність. Більшість підходів до отримання статистичних висновків передбачають збір інформації за допомогою простої випадкової вибірки. Однак метод простий випадкової вибірки має як мінімум чотири істотні обмеження:

1. часто складно створити основу виборочногo спостереження, яка дозволила б провести просту випадкову вибірку.

2. результатом застосування простий випадкової вибірки може стати велика сукупність, або сукупність, розподілена по великій географічної території, Що значно збільшує час і вартість збору даних.

3. результати застосування простий випадкової вибірки часто характеризуються низькою точністю і більшою стандартною помилкою, ніж результати застосування інших імовірнісних методів.

4. в результаті застосування SRS може сформуватися нерепрезентативна вибірка. Хоча вибірки, отримані простим випадковим відбором, в середньому адекватно представляють генеральну сукупність, деякі з них вкрай некоректно представляють досліджувану сукупність. Така ймовірність особливо велика при невеликому обсязі вибірки.

· Проста бесповторная вибірка. Процедура побудови вибірки така ж, тільки картки з номерами респондентів не повертаються назад в колоду.

1. Систематична імовірнісна вибірка. Є спрощеним варіантом простий ймовірнісної вибірки. На основі списку генеральної сукупності через певний інтервал (К) відбираються респонденти. Величина До визначається випадково. Найбільш достовірний результат досягається при однорідної генеральної сукупності, інакше можливі збіг величини кроку і якихось внутрішніх циклічних закономірностей вибірки (змішання вибірки). Мінуси: такі ж як і в простій ймовірнісної вибіркою.

2. Серійна (гніздова) вибірка. Одиниці відбору є статистичні серії (сім'я, школа, бригада і т. П.). Відібрані елементи піддаються суцільного обстеження. Відбір статистичних одиниць може бути організований за типом випадкової або систематичної вибірки. Мінус: Можливість більшої однорідності, ніж у генеральній сукупності.

3. Районована вибірка. У разі неоднорідної генеральної сукупності, перш, ніж використовувати вірогідну вибірку з будь-якою технікою відбору, рекомендується розділити генеральну сукупність на однорідні частини, така вибірка називається районированной. Групами районування можуть виступати як природні утворення (наприклад, райони міста), так і будь-яка ознака, закладений в основу дослідження. Ознака, на основі якого здійснюється поділ, називається ознакою розшарування і районування.

4. «Зручна» вибірка. Процедура «зручною» вибірки полягає у встановленні контактів з «зручними» одиницями вибірки - з групою студентів, спортивною командою, з друзями і сусідами. Якщо необхідно отримати інформацію про реакцію людей на нову концепцію, така вибірка цілком обгрунтована. «Зручний» вибірку часто використовують для попереднього тестування анкет.

невероятностной вибірки

Відбір в такій вибірці здійснюється не за принципами випадковості, а за суб'єктивними критеріями - доступності, типовості, рівного представництва і т.д.

1. Квотна вибірка - вибірка будується як модель, яка відтворює структуру генеральної сукупності у вигляді квот (пропорцій) досліджуваних ознак. Число елементів вибірки з різним поєднанням досліджуваних ознак визначається з таким розрахунком, щоб воно відповідало їх частці (пропорції) в генеральній сукупності. Так, наприклад, якщо генеральна сукупність у нас представлена \u200b\u200b5000 осіб, з них 2000 жінок та 3000 чоловіків, тоді в квотною вибіркою у нас будуть 20 жінок і 30 чоловіків, або 200 жінок і 300 чоловіків. Квотувати вибірки найчастіше грунтуються на демографічних критеріях: стать, вік, регіон, дохід, освіту та інших. Мінуси: зазвичай такі вибірки нерепрезентативним, тому що не можна врахувати відразу кілька соціальних параметрів. Плюси: легкодоступний матеріал.

2. Метод сніжної грудки. Вибірка будується наступним чином. У кожного респондента, починаючи з першого, просяться контакти його друзів, колег, знайомих, які підходили б під умови відбору і могли б взяти участь в дослідженні. Таким чином, за винятком першого кроку, вибірка формується за участю самих об'єктів дослідження. Метод часто застосовується, коли необхідно знайти і опитати важкодоступні групи респондентів (наприклад, респондентів, які мають високий дохід, респондентів, які належать до однієї професійної групи, респондентів, що мають будь-які схожі хобі / захоплення і т.д.)

3. Стихійна вибірка - вибірка так званого «першого зустрічного». Часто використовується в теле- і радіоопросах. Розмір і склад стихійних вибірок заздалегідь не відомий, і визначається тільки одним параметром - активністю респондентів. Мінуси: неможливо встановити яку генеральну сукупність являють опитані, і як наслідок - неможливість визначити репрезентативність.

4. Маршрутний опитування - часто використовується, якщо одиницею вивчення є сім'я. На карті населеного пункту, В якому буде проводитися опитування, нумеруються всі вулиці. За допомогою таблиці (генератора) випадкових чисел відбираються великі числа. Кожне велике число розглядається як що складається з 3-х компонентів: номер вулиці (2-3 перших числа), номер будинку, номер квартири. Наприклад, число 14832: 14 - це номер вулиці на карті, 8 - номер будинку, 32 - номер квартири.

5. Районована вибірка з відбором типових об'єктів. Якщо після районування з кожної групи відбирається типовий об'єкт, тобто об'єкт, який за більшістю досліджуваних в дослідженні характеристик наближається до середніх показників, така вибірка називається районированной з відбором типових об'єктів.

Стратегії побудови груп

Відбір груп для їх участі в психологічному експерименті здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої і зовнішньої валідності.

· Рандомизация (випадковий відбір)

· попарний відбір

· стратометріческая відбір

· наближене моделювання

· Залучення реальних груп

рандомизация, або випадковий відбір, Використовується для створення простих випадкових вибірок. Використання такої вибірки грунтується на припущенні, що кожен член популяції з однаковою ймовірністю може потрапити до вибірки. Наприклад, щоб зробити випадкову вибірку з 100 студентів вузу, можна скласти папірці з іменами всіх студентів вузу в капелюх, а потім дістати з неї 100 папірців - це буде випадковим відбором (Гудвін Дж., С. 147).

попарний відбір - стратегія побудови груп вибірки, при якому групи випробовуваних складаються із суб'єктів, еквівалентних по значущим для експерименту побічним параметрам. Дана стратегія ефективна для експериментів з використанням експериментальних і контрольних груп з кращим варіантом - залученням блізнецових пар (моно- і дизиготних), так як дозволяє створити ...

стратометріческая відбір - рандомізація з виділенням страт (або кластерів). При даному способі формування вибірки генеральна сукупність ділиться на групи (страти), що володіють певними характеристиками (стать, вік, політичні уподобання, освіта, рівень доходів тощо.), І відбираються випробовувані з відповідними характеристиками.

наближене моделювання - складання обмежених вибірок і узагальнення висновків про цю вибірці на ширшу популяцію. Наприклад, за участю в дослідженні студентів 2-го курсу університету, дані цього дослідження поширюються на «людей у \u200b\u200bвіці від 17 до 21 року». Допустимість подібних узагальнень вкрай обмежена.

Наближене моделювання - формування моделі, яка для чітко визначеного класу систем (процесів) описує його поведінку (або потрібні явища) з прийнятною точністю.

gastroguru 2017