3. Обсяг вибірки
Визначення обсягу вибірки є одним з найважливіших кроків при побудові плану вибірки. Занадто малий розмір вибірки виллється у велику невизначеність, занадто велика ж вибірка значно збільшить витрати. Існує можливість кількісно визначити очікувану ступінь довіри до майбутніх оцінок, здійснених на основі ймовірнісної вибірки. Зі збільшенням числа пробних площ зменшується мінливість похибки оцінювання, зростає точність оцінювання і оцінка набуває вищого ступеня довіри. Зазвичай відоме точне значення оцінки, але не справжній стан лісу. Використовуючи ймовірнісну вибірку, можна визначити ймовірність того, що оцінка знаходиться у межах певного інтервалу відносно істинного значення. Це і є задачами довірчого інтервалу, очікуваного діапазону пропорцій, який, імовірно, містить істинну, але невідому пропорцію лісу; і коефіцієнту довіри, імовірності того, що довірчий інтервал міститиме істинну пропорцію лісу.
Найпростішим випадком є оцінювання пропорцій за допомогою простої випадкової вибірки, наприклад, оцінювання залісненої частини країни. Припустимо, що національна оцінка лісів охоплює вибіркову сукупність обсягом у 5 млн гектарів, а у простій випадковій вибірці 400 з 1000 пробних площ є залісненими. Оцінена лісистість дорівнює 40%, але якою є ступінь довіри до цієї оцінки? Припустимо, що прийнятним є значення коефіцієнта довіри у 80%. Це значить, що для 80 пробних площ істинна, але невідома лісистість знаходиться у межах довірчого інтервалу. Виходячи з доступних таблиць та рисунків (Czaplewski 2003), при n=1000 і оцінці лісистості у 40%, довірчим інтервалом є значення від 38,0% до 42,0%. У якості іншого прикладу, припустимо, що у генеральній сукупності існує рідкісний тип лісу, але точний його обсяг невідомий. Проте, жодна ділянка цього рідкісного типу лісу не була помічена у простій випадковій вибірці обсягом у n=1000 пробних площ, таким чином, оцінений відсоток площі, зайнятої цим рідкісним типом лісу складає 0%. Для того ж значення коефіцієнта довіри у 80%, довірчий інтервал для цієї оцінки складає від 0,0% до 0,2%. Отже, оцінка величини площі, займаної цим рідкісним типом лісу на загальній площі у 5 млн гектарів становить від 0 до 10000 гектарів. Останнім прикладом є муніципалітет площею 100000 гектарів, для якого здійснено вимірювання вибірки обсягом n=20 з 1000 пробних площ, яке виявило, що 18 з обміряних пробних площ вкриті лісом. Оцінена лісистість цього муніципалітету становить 90% з довірчим інтервалом від 75,5% до 97,3%, або від 75500 до 97300 гектарів. Інші розрахунки обсягів вибірки можна здійснити за допомогою інтерактивних калькуляторів обсягів вибірки, які доступні у мережі Інтернет. Ці приклади демонструють можливість отримання точних оцінок для поширених типів лісу на національному рівні з використанням відносно невеликої кількості пробних площ. Проте, для оцінювання рідкісних типів лісу або невеликих частин країни часто застосовуються пробні площі більших розмірів. Саме розмір проби, а не обсяг вибірки з генеральної сукупності, визначальним чином впливає на точність оцінок національного оцінювання лісів.
Визначення необхідного обсягу вибірки вимагає оцінки середньоквадратичного відхилення різниць між значеннями показників на рівні пробних площ та їх середніми значеннями. Це середньоквадратичне відхилення можна оцінити за допомогою експериментального дослідження або інвентаризації, під час якої здійснюється вимірювання невеликої за обсягом вибірки пробних площ з метою визначення мінливості серед них. Наприклад, припустимо, що експериментальне дослідження включає 60 пробних площ, на кожній з яких вимірюється запас деревини. Далі, припустимо, що середній запас становить =100 м3/га, мінливість серед пробних площ складає
=2500м6/га2, а стандартна похибка рівна
=50 м3/га. Якщо спостереження експериментального дослідження розподілені нормально, близько 1/6 всіх проб матимуть запас (100-50)=50 м3/га або менше, інша 1/6 частина всіх проб матиме запас 100+50=150 м3/га або більше. Припустимо, що вимогою точності національної оцінки лісів є оцінити середній запас на гектар з допуском або максимально допустимою різницею у ±5% (Dmax=0.05) за коефіцієнту довіри 66%. Необхідний для цього обсяг вибірки приблизно дорівнює 100 пробним площам.
Якщо ці вимоги точності національного оцінювання лісів поширюються на всю націю, тоді 100 пробних площ достатньо. Якщо ці вимоги точності національного оцінювання лісів стосуються кожної з 10 суб-національних одиниць, то всього потрібно 1000 пробних площ. Обсяг вибірки значно зростає при зменшенні допусків. У наведеному прикладі, зменшення допусків до ±1% потребувало би збільшення обсягу вибірки зі n=100 до n=2500 пробних площ (рівняння 15). Необхідний обсяг вибірки збільшується при зростанні коефіцієнту довіри. Наприклад, для того, щоб підняти точність від коефіцієнту довіри у 66% до 95%, потрібно збільшити обсяг вибірки у чотири рази. Точніші та більш деталізовані розрахунки необхідних обсягів вибірки можна здійснити за допомогою інтерактивних калькуляторів обсягу вибірки, доступних у мережі Інетрнет за адресою: http://calculators.stat.ucla.edu/.