GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки...

38
GTSS Global Adult Tobacco Survey (GATS) Руководство по взвешиванию выборки

Transcript of GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки...

Page 1: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

GTSS Global Adult Tobacco Survey (GATS)

Руководство по взвешиванию выборки

Page 2: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без
Page 3: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS)

Руководство по взвешиванию выборки

Редакция 2.0 Ноябрь 2010 г.

Page 4: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

ii

Глобальное обследование употребления табака среди взрослых (GATS)

Комплексный стандартный протокол ………………………………………………………………………………

Вопросник GATS

Основной вопросник с дополнительными вопросами

Повопросная инструкция

Состав выборки GATS

Руководство по составлению выборки

Руководство по взвешиванию выборки

Проведение выездных работ GATS

Руководство выездного интервьюера

Руководство выездного супервайзера

Руководство по составлению карт и списков

Управление данными GATS

Руководство программиста по программе General Survey System

Инструкции по программированию основного вопросника

План осуществления управления данными

Руководство по обучению управлению данными

Обеспечение качества GATS: руководство и документация

Пакет GATS по анализу и отчетности

Шаблон бюллетеня

Страновой отчет: план табуляции и руководство

Определения показателей

Выпуск и распространение данных GATS

Политика выпуска данных

Распространение данных: руководство по первоначальному выпуску данных

Вопросы по табаку для обследований: комплект ключевых вопросов

из Глобального обследования употребления табака

среди взрослых (GATS)

Рекомендуемая ссылка Совместная группа Глобального обследования употребления табака среди взрослых. Глобальное

обследование употребления табака среди взрослых (GATS): Руководство по взвешиванию выборки. Редакция 2.0. Атланта, Джорджия: Центры по контролю и профилактике заболеваний (CDC), 2010 г..

Page 5: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

iii

Благодарность Сотрудничающие организации по GATS

Центры по контролю и профилактике заболеваний (CDC)

Фонд CDC

Школа общественного здравоохранения Блумберга при Университете Джонса Хопкинса

RTI International

Школа общественного здравоохранения Гиллингса при университете Северной Каролины

Всемирная организация здравоохранения

Финансовая поддержка

Финансовая поддержка оказывается Инициативой Блумберга по сокращению потребления табака, программой Bloomberg Philanthropies через Фонд CDC.

_______________________________________________________________________________________________________________________

Отказ от ответственности: Мнения, выраженные в данном руководстве, не обязательно отражают мнения сотрудничающих организаций по GATS.

Page 6: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

iv

Page 7: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

v

Содержание

Глава Страница

1. Введение .......................................................................................................................................... 1-1

1.1 Обзор Глобального обследования употребления табака среди взрослых ...................... 1-1

1.2 Использование данного руководства ................................................................................... 1-2

2. Обзор весов выборки GATS......................................................................................................... 2-1

3. Рекомендуемый подход ................................................................................................................ 3-1

3.1 Базовый вес ............................................................................................................................ 3-2

3.2 Корректировка на неполучение ответов в единице выборки ............................................. 3-5

3.3 Корректировка путем пост-стратификационной калибровки ............................................ 3-12

4. Обеспечение качества весов выборки GATS ........................................................................... 4-1

5. Библиография ................................................................................................................................. 5-1

Page 8: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

vi

Page 9: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 1-1 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 1: Введение

1. Введение

Употребление табака является основной предотвратимой причиной преждевременной

смертности и заболеваемости во всем мире. Примерно 5,4 миллиона человек умирают каждый год

из-за болезней, связанных с табаком - ожидается, что эта цифра увеличится до более восьми

миллионов в год к 2030 году. Если нынешние тенденции сохранятся, употребление табака может

убить миллиард человек к концу этого столетия. Подсчитано, что более чем три четверти из этих

смертей произойдет в странах с низким и средним уровнем дохода. Механизм эффективного и

систематического наблюдения необходим для контроля и борьбы с эпидемией.

Глобальное обследование употребления табака среди взрослых (GATS), компонент

Глобальной системы эпиднадзора за потреблением табака (GTSS), является мировым стандартом

систематического мониторинга употребления табака среди взрослых и отслеживания ключевых

показателей по борьбе против табака. Обследование GATS является национальным

репрезентативным обследованием домашних хозяйств с участием взрослых в возрасте 15 лет и

старше, с помощью стандартного основного вопросника, выборки, процедур сбора и управления

данными, которые были рассмотрены и одобрены

международными экспертами. Обследование GATS

предназначено для укрепления потенциала стран в области

разработки, осуществления и оценки мер борьбы против

табака.

Чтобы максимально увеличить эффективность

данных, собранных в результате проведения обследования

GATS, было создано несколько руководств. Данные руководства предназначены для того, чтобы

предоставить странам стандартные требования, а также некоторые рекомендации по разработке и

проведению обследования на каждом этапе процесса GATS. Кроме того, они разработаны, чтобы

предложить руководство о том, как каждая страна может адаптировать некоторые элементы

протокола GATS для того, чтобы максимально повысить степень использования данных внутри

страны. Для того чтобы обеспечить согласованность и сопоставимость данных между странами,

настойчиво рекомендуется соблюдать стандартный протокол.

1.1 Обзор Глобального обследования употребления табака среди взрослых

Обследование GATS предназначено для того, чтобы получить оценки по взрослому

населению на национальном и субнациональном уровне в разных странах. Целевая группа

населения включает в себя всех не находящихся в закрытых учреждениях мужчин и женщин в

возрасте 15 лет и старше, которые считают, что эта страна является их обычным местом

проживания. Все члены целевой группы населения будут выбраны из домохозяйств, которые

являются их обычным местом проживания.

Руководства GATS предоставляют

систематические рекомендации

относительно организации и

проведения обследования.

Page 10: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 1-2 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 1: Введение

В обследовании GATS используется методология географически сгруппированного

многоэтапного выборочного исследования для определения конкретных домохозяйств, с которыми

будут работать Выездные интервьюеры. Во-первых, страна разделяется на первичные единицы

выборки (PSU), сегменты в этих первичных единицах

выборки, и домашние хозяйства в пределах этих сегментов.

Затем производится случайная выборка домохозяйств для

участия в GATS.

Интервью GATS состоит из двух частей: Вопросника

для домохозяйства и Индивидуального вопросника.

Обследование по Вопроснику для домохозяйств (бытовой

скрининг) и Индивидуальному вопроснику (индивидуальное

интервью) будет проводиться с использованием электронных

устройств сбора данных.

По каждому адресу в выборке, Выездные интервьюеры будут проводить опрос по

Вопроснику для домохозяйства одного взрослого, который в настоящее время проживает в

домохозяйстве. Цели Вопросника для домохозяйства состоят в том, чтобы определить,

соответствует ли выбранное домохозяйство требованиям GATS о правомочности участия, и

составить список или реестр всех, имеющих право на участие в обследовании, членов семьи.

После того, как список имеющих право участвовать в обследовании членов домохозяйства

составлен, один человек будет случайным образом выбран для заполнения Индивидуального

вопросника. В Индивидуальном вопроснике задаются вопросы об общих сведениях; о потреблении

курительного табака; бездымного табака; прекращении употребления; пассивном курении; об

экономике; СМИ и знаниях, отношении и восприятии табака.

1.2 Использование данного руководства

Это руководство предназначено для того, чтобы изложить требования, которым страны

должны следовать при вычислении весовых выборки GATS. В первой главе приводится

справочная информация об обследовании GATS. Последующие главы посвящены ниже

следующему:

• в Главе 2 определяется вес выборки, указывается, когда в процессе обследования

высчитываются веса, дается обзор обоснования вычислительного процесса и

описывается, как аналитик данных использует информацию о весах.

• в Главе 3 довольно подробно описывается каждый из этапов рекомендуемого подхода

вычисления весов. Каждый из этих этапов иллюстрируется примером, основанным на

типе респондента, который может встретиться в выборке GATS.

• в Главе 4 рекомендуется предпринять ряд шагов, чтобы обеспечить получение весов

высокого е качества.

Следует отметить что, хотя в данном руководстве предлагается пошаговый шаблон

вычисления весов обследования, может потребоваться модификация данного вычислительного

шаблона в связи с конкретными условиями стран относительно схемы выборки, нужд анализа и

наличия вспомогательных данных для расчета корректировок. Сотрудничество между

статистиками страны, национальными координаторами CDC и Комитетом по рассмотрению

выборки (SRC) важно для обеспечения качества взвешивания и корректировки выборки.

Интервью GATS состоит из двух

частей: Вопросника для домохозяйства и Индивидуального вопросника. Обследование по этим

вопросникам будет проводиться с

использованием электронных

устройств сбора данных.

Page 11: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 2-1 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 2: Обзор весов выборки GATS

2. Обзор весов выборки GATS

Вес выборки представляет собой статистическое измерение, связанное с записью данных

любого респондента обследования в выборках населения, где в полном объеме использовались

методы случайного отбора при произведении выборки. В общих чертах, индивидуальный вес в

выборке обычно представляет собой обратную величину откорректированной вероятности

получения данных от респондента. В большинстве случаев, эта вероятность является просто

изначальной вероятностью респондента быть выбранным исходя из схемы выборки. Эта обратная вероятность, или базовый вес ( jB ), обычно корректируется для учета непреднамеренного

дисбаланса выборки, возникающего во время процесса проведения обследования1. Может

применяться несколько корректировок веса. Все являются мультипликативными. Если вес не

масштабируется для аналитических целей (например, “калибруется”, чтобы подвести к общей

численности охваченного населения), его значение можно интерпретировать, как количество

членов населения, которое представляет респондент. Могут понадобиться отдельные наборы

весов, когда данные для анализа собираются по разным типам данных или пунктов анализа,

связанных с респондентом. Например, если данные в обследовании домашних хозяйств

собираются по выбранным домохозяйствам и по одному жителю, выбранному случайным образом

в каждом из этих домохозяйств, отдельные наборы весов будут вычисляться для данных по

домохозяйствам и для данных по жителям. Однако, так как в обследовании GATS обрабатываются

только данные уровня индивидуальных респондентов, потребуются весы только индивидуального

уровня.

В то время, как общее статистическое обоснование применения весов для оценки выборок

населения хорошо известно (Horvitz and Thompson, 1952), не существует универсального

протокола их вычисления. Так сложилось отчасти в результате различий выборок по их схеме,

качеству документации о процессах отбора выборки и её комплектации, а также наличия

вспомогательной информации о выборке и населении для выявления и исправления дисбаланса в

выборке, возникающего в результате дифференциального охвата рамками обследования и уровня

неполучения ответов. Таким образом, фактические вычислительные шаги весов выборки могут

отличаться в разных обследованиях. Тем не менее, определенный набор таких шагов,

перечисленных ниже, как правило, применяется при вычислении веса по каждой (т.е. j-ой) записи данных индивидуального респондента, с окончательным откорректированным весом ( jW )

значение которого определяется на каждом этапе, как более подробно описано ниже:

1. Определите базовый вес ( jB ) чтобы учесть все этапы случайного выбора, в результате

которых получилась данная выборка населения,

2. Откорректируйте на неполучение ответов ( ( nr )jA ), чтобы компенсировать дисбаланс выборки,

возникший в результате разной степени успешности в привлечении к участию в выборке,

1 Концепция “дисбаланса” здесь используется просто, чтобы показать, что демографическое представление выборочной

совокупности искажается в некоторой степени факторами, связанными с фазами составления выборки и привлечения к участию в обследовании. Другими словами, иные репрезентативные выборки, полученные не случайным образом, несколько менее могут представлять население.

Page 12: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 2-2 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 2: Обзор весов выборки GATS

3. Далее откорректируйте на неполный охват рамками ( (cov)jA ), чтобы откорректировать

дисбаланс, возникший в результате того, что рамки выборки не полностью охватывают

целевое население обследования, и

4. Далее откорректируйте, чтобы калибровать ( ( cal )jA ) окончательный набор откорректированных

весов в соответствии с распределением населения по характеристикам, которые тесно

связаны с ключевыми показателями результатов обследования (т.е., поведение в плане

потребления табака в обследовании GATS).

Фактическая последовательность выполняемых шагов при вычислении набора

статистических весов выборки населения является особенно важной, так как веса, вычисляемые

на каждом определенном этапе, зависят от вычисленных результатов каждого предыдущего этапа.

Окончательный вес любого респондента является произведением вычисленных результатов по

данному респонденту по всем шагам в следующей последовательности:

( nr ) (cov) ( cal )j j j j jW B A A A= (1)

Чтобы понять логику процесса вычисления весов выборки для обследования, где жители

отобранных домохозяйств являются членами целевой группы населения, сначала рассмотрим, что

член населения при обследовании GATS сможет предоставить данные только, если все три из

следующих событий (т.е., F, S, и R) произойдут:

• Событие F: Домохозяйство данного человека и сам человек включен в список

домохозяйств и членов домохозяйств, который является рамками выборки,

используемыми для выборки GATS;

• Событие S: Учитывая событие F, домохозяйство данного человека и сам человек

должны быть случайно выбраны для участия в GATS; и

• Событие R: Учитывая событие S, домохозяйство данного человека и сам человек

должны согласиться, в свою очередь, стать участником GATS и заполнить

соответствующий вопросник.

Вероятность того, что данные человека будут использованы для оценки выборки, является

произведением вероятностей происхождения этих трех событий. Позже мы увидим, что для

завершения шагов (1), (2), и (3) потребуется определить или оценить вероятность событий F, S, и

R. Калибровка выборки (или “пост-стратификация”) служит для контроля, чтобы выборка не

потеряла свою действительность в результате воздействия внешних факторов, не

урегулированных корректировками на неполучение ответов и на охват рамками в Шагах (2) и (3).

Эти факторы могут включать в себя случайные изменения демографического состава выборки по

отношению к переменным, не используемым для определения слоя выборки, а также различные

факторы неполучения ответов и недостаточного охвата, связанные не с теми переменными,

которые определяют корректировочные ячейки, используемые для проведения корректировок в

шагах (2) и (3). Так как делать шаг (3) часто является непрактичным, корректировка на неполный

охват рамками обычно выполняется в рамках проведения калибровки.

Page 13: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 2-3 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 2: Обзор весов выборки GATS

Веса выборки важны для многих ситуаций анализа. Например, они используются при

составлении точечных оценок характеристик населения (например, уровень текущей

распространенности курения), а также при оценке вариантности этих характеристик, хотя другие

особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без замены) также

важны для определения последней. Таким образом, веса важны для многих вариантов

применения данных, включая описательный анализ и сравнительное тестирование (например, для

существенных различий в уровнях распространенности среди регионов страны). Они также иногда

используются для регрессионного моделирования (например, для выявления предшествующих

факторов курения). Веса, таким образом, часто являются необходимой, но не всегда достаточной

характеристикой схемы выборки для анализа данных обследования. Например, если использовать

только веса, но игнорировать стратификацию и кластерную выборку при оценке вариантности

оценок обследования, сообщаемая вариантность и выводы тестирования гипотез вполне могут

быть неправильными.

Один набор весов подготавливается для каждого набора единиц наблюдения обследования.

В обследованиях часто бывает несколько наборов таких единиц наблюдения. Например, если

согласно плану сбора данных обследования требуется собрать информацию о домохозяйствах

(например, доход, СЭС, расстояние до учреждений, предоставляющих медицинские услуги) и об

отдельных членах этих домохозяйств (например, поведение в плане курения, демография и т.д.),

то отдельный набор весов может понадобиться для каждой единицы наблюдения (т.е. для

домохозяйств и для отдельных людей). Более того, веса могут отличаться по домохозяйствам и

жителям респондентам, если выборка делается в рамках домохозяйства, чтобы выбрать человека,

который предоставит данные индивидуального уровня. Такая разница наблюдалась бы и в GATS,

если бы собирались данные и по домохозяйствам, и по отдельным лицам, так как один

правомочный житель выбирается в каждом участвующем домохозяйстве.

Процесс вычисления весов обычно происходит после сбора данных и как только данные

были обработаны и очищены для аналитика. Они не могут быть получены до завершения

выездных работ, так как они применяются к окончательной выборке респондентов, и их

вычисление зависит от итоговой окончательной информации от сбора данных. Они также должны

быть готовы до начала анализа, так как аналитикам, использующим данные, они понадобятся.

Технические специалисты, участвующие в отборе выборки и помогающие в проведении выездных

работ, обычно лучше всего подготовлены для вычисления весов, в силу их знаний о целевой

группе населения и о том, как составлялась и производилась выборка. По мере необходимости,

центральный персонал GATS может оказывать помощь и поддержку в процессе вычисления весов.

Наконец, для обеспечения качества весов, процесс вычисления весов полностью рассматривается

внешними экспертами, чтобы гарантировать соблюдение соответствующих процедур (см. Раздел

5 руководства GATS Обеспечение качества: руководство и документация).

Page 14: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 2-4 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 2: Обзор весов выборки GATS

Page 15: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-1 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

3. Рекомендуемый подход

В этой главе данного руководства довольно подробно изложен трехэтапный подход,

соответствующий основным компонентам, который рекомендуется применять техническим

специалистам внутри стран при вычислении весов их выборки

GATS. Эти этапы или шаги включают в себя следующее:

вычислите базовый вес каждого респондента выборки,

откорректируйте базовые веса на дифференциальный

уровень неполучения ответов в выборке, и откалибруйте

откорректированные веса в соответствии с известными

общими данными о населении. Более общее описание

каждого из этих шагов можно найти в обзорах Lessler и

Kalsbeek (1992) и Kalton и Flores-Cervantes (2003). Наш

подход в описании этих этапов состоит в том, чтобы

представить реалистичный пример, соответствующий

обследованию GATS для рассмотрения. Рассмотрение

каждого из этих трех шагов начинается с перечисления того,

что необходимо для выполнения этого шага, а затем

представлены конкретные формулы, которые рекомендуется

применять для вычисления этого компонента веса, в качестве

части наглядного примера. Альтернативные варианты по некоторым рекомендациям предлагаются

для рассмотрения персоналу GATS в стране, хотя выбор этих альтернатив должен быть

полностью обоснован и сделан в тесном сотрудничестве национальных координаторов стран и

Комитета по рассмотрению выборки (SRC) до их применения.

Описание наглядного примера

Пример, используемый для иллюстрации

вычислительного процесса весов GATS, фокусируется на

проблеме определения окончательного откорректированного

веса в выборке вымышленного индивидуального респондента (именуемого в дальнейшем, как R) в выборке страны, где

рандомизация по полу не требовалась. Исходим из того, что

схема выборки, в рамках которой был выбран этот человек,

это стратифицированная трехступенчатая выборка домашних хозяйств с определенной

геополитической зоной в качестве единицы площади переменного размера в качестве первичной

единицы выборки (PSU), примерно равные по размеру области “сегменты”, состоящий примерно

из 200 домохозяйств, в качестве вторичной единицы выборки(SSU), и отдельные домохозяйства,

выбранные в рамках выбранных сегментов. В этом примере мы предполагаем, что не было никаких пропущенных домохозяйств при создании списка домохозяйств в сегменте респондента R, и что распределение по полу не было частью процесса выбора респондента R; но на практике эти

вопросы, возможно, придется пересматривать (соответствующие методы решения этих вопросов представлены ниже в этом руководстве)1. Наконец, мы предполагаем, что респондент R выбран из

1 Дополнительный выбор пропущенных домохозяйств необходим при обнаружении домохозяйств, не включенных в список рамок выборки путем процедуры пропущенного домохозяйства (например, “полуоткрытый интервал”) и когда количество таких обнаруженных домохозяйств достаточно велико, чтобы потребовалось проведение случайного дополнительного выбора домохозяйств, не включенных в список. Распределение по полу должно быть сделано в выборках GATS, когда по

РЕКОМЕНДАЦИЯ:

Следующий трехэтапный подход

рекомендуется применять для

каждой выборки страны GATS:

(1) вычислите базовый вес каждого

респондента выборки, (2)

откорректируйте базовые веса на

неполучение ответов, и

(3) откалибруйте

откорректированные веса в

соответствии с известными

данными о населении

НАГЛЯДНЫЙ ПРИМЕР:

Справочная информация о

вымышленном респонденте GATS

(R)

Page 16: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-2 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

реестра домохозяйства, который был введен в портативный компьютер, который также использовался для проведения интервью GATS с респондентом R. Другие предполагаемые детали, касающиеся выбора и получения согласия на участие респондента R, будут упоминаться

при описании каждого шага.

3.1 Базовый вес

Необходимо для выполнения этого вычислительного шага:

• Хорошо задокументированные вероятности выбора на каждой стадии процесса отбора

выборки, если, предпочтительно, они уже были вычислены.

ИЛИ

• Специальные знания о том, как вычислить вероятности, соответствующие методам

случайного отбора, примененным на каждом этапе процесса выборки. Этапы выбора

включают в себя: стадии выборки, распределение домохозяйств по полу (при

необходимости), и дополнительный под выбор домашних хозяйств, обнаруженных в

результате процедуры выявления пропущенных домохозяйств, если применимо.

• Листы выбора и/или компьютерный код выбора программного обеспечения по каждому этапу процесса произведения выборки, если вероятности выбора должны быть

определены во время вычисления весов.

Вычисление базовых весов на наглядном примере:

Базовый вес респондента в выборке любой вероятности представляет собой просто

единицу, поделенную на общую вероятность выбора респондента в зависимости от проделанных

этапов при выборе респондента. Для вычисления базового веса респондента GATS, таким

образом, потребуется ответ на вопрос: какова была статистическая вероятность того, что при

данной схеме выборки будет выбран данный респондент?

В Руководстве по составлению выборки GATS (Глава 11) описываются следующие

соответствующие компоненты общей вероятности выбора в случае, когда страна следует рекомендованному поэтапному подходу составления выборки. Индексы α и k (совместно для α -

ной PSU (первичной единице выборки) и k-ной SSU (вторичной единице выборки), соответственно)

в этом описании совместно соответствующие “области” (сегменту) g, который выбран в результате двух этапов выборки при выборе респондента R:

( )kpα1

= Безусловная вероятность выбора α -ной PSU (геополитическая единица площади,

где живет R ) и k-ной SSU (сегмент в котором живет R );

( )kpα2

= Условная вероятность (при выборе данных PSU и SSU) выбора домохозяйства в

котором живет R;

причинам особенностей культуры страны хотят, чтобы пол интервьюеров совпадал с полом выбранных респондентов, и будут использоваться группы интервьюеров одного пола, или когда определенная гендерная группа должна быть представлена большим представительством по статистическим причинам. Каждое выбранное домохозяйство случайным образом определяется, как “мужское” (только правомочные жители мужчины включаются в реестр выбора респондентов) или “женское” (только правомочные жители женщины включаются в список).

Page 17: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-3 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

( )k ipα3 = Для вымышленного респондента GATS (R), эта вероятность=1, Однако, требуется

условная вероятность (при данных выборах PSU, SSU, и домохозяйства) случайного определения домохозяйства респондента R, как “женского”, если

применяется рандомизация по полу;

( )kipα4

= Условная вероятность (при данных выборах PSU, SSU, домохозяйства и

распределения по полу) случайного выбора домохозяйства респондента R, если его не было в первоначальном списке рамок домохозяйств kα -ного сегмента и

оно было обнаружено в рамках процедуры выявления пропущенных домохозяйств,

в противном случае эта вероятность=1; и

( )ki jpα5 = Условная вероятность (при данных выборах PSU, SSU, домохозяйства,

распределения по полу и выбору пропущенного домохозяйства) случайного выбора респондента R из реестра правомочных жителей домохозяйства респондента R.

Обратите внимание, что каждое из событий выбора, соответствующее этим вероятностям, должно произойти, чтобы респондент R был выбран в выборку GATS. Тогда безусловная совместная вероятность выбора R ( k i jα - ного человека) в выборку GATS составляет:

( ) ( ) ( ) ( ) ( )

ki j k k ki ki ki jp p p p p pα α α α α α= ⋅ ⋅ ⋅ ⋅1 2 3 4 5

. (2)

так как вероятность совместных последовательных событий является безусловной вероятностью

первого события в последовательности, помноженного на условные вероятности каждого

последующего события после данных предыдущих событий в последовательности. Таким образом, объединенный базовый вес респондента R составляет:

k i j ( ) ( ) ( ) ( ) ( )k i j k k k i k i k i j

Bp p p p p pα

α α α α α α

= =⋅ ⋅ ⋅ ⋅1 2 3 4 5

1 1 . (3)

Как видно из уравнения (3), мы должны определить каждый из компонентов безусловной совместной вероятности выбора респондента R для вычисления базового веса респондента R.

Предполагая, что какая-либо форма выборки без замен с вероятностью выбора пропорциональной

размеру (PPS) используется для выбора PSU (первичных единиц выборки) в рамках первой стадии слоя выборки, тогда если iN ,= 2 4 6 2 является размером (по количеству домохозяйств согласно

последней переписи) PSU респондента R, I = 2 число выбранных PSU в слое выборки, из которых

было выбрано PSU респондента R, и сумма размеров всех PSU в этом слое составляет N ,αα

= 338 754, безусловная вероятность выбора PSU респондента R будет,

( ) I N ( ) ( , )p . xN ,

αα

αα

−⋅ ⋅= = =

1 22 2 46214536 10

338 754 . (4)

Если SSU (вторичная единица выборки) респондента R является одним из Kα = 2 сегментов,

выбранных (без замен) путем простой случайной выборки из Sα = 1 2 сегментов PSU (первичной

единицы выборки) респондента R, тогда условная вероятность (при данном выборе PSU) выбора

SSU респондента R составляет,

Page 18: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-4 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

( )k ( )

Kp

αα

= = =1 2 1

1 2 6 , (5)

и безусловная совместная вероятность выбора PSU и SSU респондента R составляет,

( ) ( ) ( )k k( )

I N Kp p p ( . x ) ( / ) . x

N Sα α

α α αα α

α

− −

⋅ = = ⋅ = ⋅ =

1 1 1 2 314536 10 1 6 2 4226 10

(6)

В Руководстве по составлению выборки GATS описывается два метода выбора

домохозяйств из выбранных сегментов или PSU. Если систематическая выборка используется для

выбора домохозяйств, условная вероятность при выборе каждого домохозяйства составляет 1 K ,

где K представляет собой интервал выбора. Если используется простая случайная выборка для

выбора домохозяйств, эта вероятность представляет собой соотношение размера выборки

домохозяйств в каждом сегменте к общему числу домохозяйств в списке рамок для каждого сегмента. Если предположить, что kH α = 2 8 домохозяйств выбраны без замены простой

случайной выборкой из kLα = 2 1 2 перечисленных домашних хозяйств в kα -ном сегменте, в

котором расположено домохозяйство респондента R, тогда условная вероятность выбора

домохозяйства R будет следующей,

( ) kk

k

Hp .

αα

= = =2 28013208

212 . (7)

Поскольку вымышленный респондент находится в стране, где рандомизация по полу не

требовалась, вероятность выбора респондента составляет,

3 1α =( )kip (8)

Отметим, что в общем, когда требуется назначение домохозяйств по полу, и kM α (М) и kFα

(Ж) соответственно, число k k kH M Fα α α= + , выбранных домохозяйств в kα -ной “зоне” (сегменте)

назначается, как “мужское” и “женское,” тогда для респондентов мужчин,

3 αα

α

=( ) kk i

k

Mp

H (9)

и для респондентов женщин,

3 αα

α

=( ) kki

k

Fp

H (10)

В общем, если респондент был выбран из домохозяйства, которое было обнаружено с

помощью процедуры выявления пропущенных домохозяйств (например, полуоткрытый интервал)

и применяется частота выборки ( ∝ ) при дополнительном выборе домохозяйств путем простой случайной выборки, тогда вероятность дополнительного выбора для любого (т.е. kiα -ного

выбранного домохозяйства будет,

Page 19: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-5 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

( )

ki kip fα α=4 . (11)

Поскольку мы предполагаем, что домохозяйство респондента R было выбрано не в

результате процедуры выявления пропущенных домохозяйств,

( )

kipα =4 1 . (12)

Для конкретного случая определения вероятности выбора респондента R в домохозяйстве, отметим, что респондент был выбран случайным образом среди k iRα = 4 членов домохозяйства

респондента, которые были включены в реестр домохозяйства. Таким образом, для

домохозяйства,

( )k i j

ki

p .Rα

α

= = =5 1 10 25

4 (13)

Сочетая все вероятности процесса выбора, который привел к выбору респондента R, мы

имеем в итоге то, что безусловная общая вероятность выбора респондента R составляет

( ) ( ) ( ) ( ) ( )

kij k k ki ki ki jp p p p p p ( . x ) ( . ) ( ) ( ) ( . ) . xα α α α α α− −= ⋅ ⋅ ⋅ ⋅ = ⋅ ⋅ ⋅ ⋅ =1 2 3 4 5 3 52 4226 10 013208 1 1 0 25 7 9992 10 , (14)

и базовый вес респондента следующий,

kij

ki j

B .p . xα

α−= = =

5

1 1125013081

7 9992 10 , (15)

и базовый вес домохозяйства составляет

( )

ki ki j kijB p / p ( . ) ( . ) .α α α= = ⋅ =5 0 25 125013081 3125 2370 (16)

Обратите внимание, что ∝ обозначается, как в последующих разделах руководства.

3.2 Корректировка на неполучение ответов в единице выборки

Необходимо для выполнения этого вычислительного шага:

• Базовый вес каждого респондента GATS.

• Окончательное расположение относительно привлечения к участию (например, отвечает,

отказ, нет дома, и т.д.) для всех выбранных домохозяйств для использования при

вычислении уровней ответов домохозяйств среди правомочных домохозяйств выборки в

каждом “сегменте” выборки. Это означает, что подсчет количества выбранных,

правомочных для участия в обследовании и участвующих домохозяйств будет необходим

по каждому сегменту выборки. При тех схемах выборки, где домохозяйства выбираются

напрямую в единицах выборки первого этапа, окончательное расположение в каждой

PSU (первичной единице выборки) будет использоваться для корректировки на

неполучение ответов от домохозяйства.

Page 20: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-6 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

• Информация об окончательном расположении относительно привлечения к участию, а

также о поле, возрасте и статусе в плане курения (курит в настоящее время или нет) из

реестров домохозяйств по всем выбранным жителям всех участвующих домохозяйств.

Дополнительная имеющаяся информация после выбора PSU такая, как

сельский/городской и регион, может также использоваться для корректировки на

неполучение ответов. Эта вспомогательная информация об отобранной выборке будет

использоваться для вычисления уровня ответов по выбранным переменным подгрупп

взвешивания. Очень важно, чтобы все переменные, используемые для расчетов уровня

ответов, были без пропусков. В том случае, когда статус относительно курения

отсутствует или неизвестен, этому члену реестра должен быть присвоен статус

“некурящего” для корректировки весов индивидуального уровня на неполучения ответов.

Вычисление корректировки на неполучение ответов на наглядном примере:

Смещение оценок на неполучение ответов простых характеристик населения таких, как

среднее, общее количество и доли, основывается исключительно на данных респондентов, и базовый вес частично определяется путем ковариации на уровне членов населения ( yπσ ) между

склонностью (т.е. вероятностью в стохастическом смысле) j-ного отдельного члена населения отвечать ( jπ ) и измерений обследования ( jy ) относительно того, что в настоящее время

оценивается на основе данных опроса (Lessler and Kalsbeek, 1992)2. Обратите внимание, что мы

временно считаем всех людей членами населения в целом и, таким образом, опускаем знак

домохозяйства (i), членом которого является этот человек.

Для (целевого) населения размера N (предполагается, что это известно) мы можем записать

смещение на неполучения ответов неоткорректированной оценки (

N

j j j jjr

r

s r y / ptyN ν

== =

1 ) средней

численности населения

так как (Y t / N= ),

yr

ˆBias( y ) πσπ

= , (17)

где для j-ного члена населения, js является 0/1показателем события S, jp является общей

вероятностью выбора (т.е., { }jPr s =1 ), jr является 0/1 показателем события R, и π есть среднее

всех склонностей к ответу ( jπ ) населения. Корректировка базового веса респондента

обследования на неполучение ответов требует оценки склонности респондента отвечать.

Обратная величина этой оцененной склонности (т.е., 1 деленная на эту цифру) становится

корректировочным коэффициентом на неполучение ответа, который умножается на базовый вес

из предыдущего шага, чтобы получить откорректированный на неполучение ответов вес

респондента.

2 Термин “склонность”, а не “вероятность” используется в связи с уровнем неполучения ответов обследования, так как

предполагаемое стохастическое поведение, а не явная рандомизация определяет результат процесса определения того, будет член выборки обследования давать ответы или нет.

Page 21: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-7 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

Точнее, корректировка весов выборки на неполучение ответов требует, чтобы каждое значение было эмпирически оценено на основании опыта неполучения ответов в выборке.

Мультипликативная индивидуальная корректировка на неполучение ответов является затем

просто обратной величиной оцененной склонности к ответу респондента:

( nr ) 1j jˆA π −= (18)

И откорректированный на неполучение ответов вес составляет,

( 2 ) ( nr )j j jW B A= (19)

Ключевым вопросом проведения данной корректировки, таким образом, является то, как

оценить склонность отдельных людей к предоставлению ответов. Уровни ответов при

взвешивании подгрупп и прогнозируемые склонности к предоставлению ответов по

соответствующей логистической таблице являются двумя подходами, которые были использованы

для корректировки на неполучение ответов. Так как подход взвешивания подгрупп проще в

реализации, и подход прогнозируемой склонности, как было в общем установлено, не превосходит

его в способности контролировать (не устранять) смещение на неполучение ответов,

рекомендуемым подходом для обследованияr GATS является корректировка с помощью

взвешивания подгрупп.

Оценку склонностей немного сложнее провести в обследовании GATS, так как отказ от

ответа может произойти и на уровне домохозяйства, и на уровне отдельного человека выборки при

получении согласия на участие респондента. Комбинированная склонность к ответу для j-ного респондента ( jπ ) таким образом, имеет два мультипликативных компонента, которые должны

быть оценены отдельно, один для учета склонности домохозяйства респондента отвечать путем

составления реестра членов домохозяйства ( ( HH )jπ ) и другой для отражения склонности

респондента отвечать на вопросы интервью GATS, после того, как респондент выбран из реестра

домохозяйства ( ( person )jπ ).

Согласно рекомендуемому подходу корректировки на неполучение ответа, каждый

компонент склонности оценивается для j-ного респондента, как уровень ответов членов подгруппы

(т.е., “класса”) выбранных членов выборки с аналогичными характеристиками и тенденциями к

ответу в качестве респондента. Вычисление уровня “ответа” компонента домохозяйства и

компонента индивидуального уровня должны проводиться, следуя рекомендациям по

взвешенному или невзвешенному уровню ответов RR1, как это определено AAPOR (Американской

ассоциацией исследований общественного мнения, 2009) и представлено в Руководстве по

составлению выборки GATS. Взвешенные уровни ответов с использованием базовых весов

являются более предпочтительными по сравнению с невзвешенными уровнями ответов. В

конечном счете, эта прерогатива стран решать, какие уровни использовать. Используя коды

расположения домохозяйств, уровни ответов домохозяйств, вычисляемые отдельно по каждому

сегменту выборки (см. описание ниже) вычисляются, как:

Уровень ответов домохозяйств = [ ][ ] [ ] [ ] [ ] [ ] [ ] (20)

Page 22: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-8 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

где

1 = Заполнен Вопросник домохозяйства, один человек выбран

2 = Заполнен Вопросник домохозяйства, никто не выбран

3 = Заполнена часть Вопросника домохозяйства, не удалось закончить составление реестра

(неполное интервью)

4 = Вопросник домохозяйства не заполнен, не смогли определить соответствующего

респондента для скрининга

5 = Никого нет дома

6 = Отказ домохозяйства

9 = Другая причина неполучения ответа домохозяйства.

Обратите внимание, что окончательный код расположения домохозяйства 2 исключается и

из числителя, и из знаменателя уровня ответов домохозяйств, так как эти домохозяйства

считаются неправомочными, вне зависимости от того, делается рандомизация по полу или нет.

При приведенном выше вычислении уровня ответов домохозяйств неправомочные

домохозяйства исключены из знаменателя, и это предполагает, что все выбранные домохозяйства

с неизвестной правомочностью (окончательные коды расположения 3, 4, 5, 6, 9) являются

правомочными и имеют право принимать участие в обследовании GATS. Это может привести к

недооценке уровней ответов домохозяйств, если домохозяйства с неизвестной правомочностью в

действительности являются неправомочными. Рекомендуется, чтобы страны оценили эту долю (e)

путем вычисления уровня известной правомочности, который составляет количество известных

правомочных хозяйств (код расположения 1), поделенное на количество известных правомочных

плюс известных неправомочных домохозяйств (код расположения 2):

[ ][ ] [ ]

household levele − =+1

1 2 (21)

Если эта доля для выборки в целом менее 0.90, странам следует откорректировать

компонент домохозяйств с неизвестной правомочностью уровня ответов домохозяйств путем

умножения числа домохозяйств неизвестной правомочности (окончательные коды расположения

3, 4, 5, 6, 9) на коэффициент (e). Следующая формула соответствует вычислению уровня ответов

RR3 согласно AAPOR (2009):

Уровень ответов домохозяйств =

[ ][ ] [ ]−=

+ + + + +1

Househould-level response rate1 3 4 5 6 9household levele

(22)

Соответствующая корректировка взвешивания подгрупп домохозяйств ( ( nr , HH )hiA ) будет

вычисляться, как единица, деленная на взвешенный уровень ответов домохозяйств по каждому

сегменту выборки.

Page 23: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-9 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

Уровень ответов отдельных лиц вычисляется в рамках стратегически сформированных

подгрупп (см. описание ниже) как:

Уровень ответов отдельных лиц =

[11]

[11] [12] [14] [15] [16] [17]− =

+ + + + +Person Level RR (23)

где

11 = Заполненный Индивидуальный вопросник

12 = Неполное интервью

13 = Выбранный человек был позже определен, как неправомочный для участия в GATS

14 = Выбранного респондента нет дома

15 = Отказ выбранного респондента

16 = Выбранный респондент некомпетентен

17 = Другая причина неполучения ответа уровня отдельных лиц.

При приведенном выше вычислении уровня ответов отдельных лиц неправомочные

отдельные лица (окончательный код расположения 13) исключены из знаменателя, и это

предполагает, что все выбранные отдельные лица с неизвестной правомочностью (окончательный

код расположения 14) являются правомочными и имеют право принимать участие в обследовании

GATS. Это может привести к недооценке уровней ответов отдельных лиц, если интервьюеры часто

выбирают респондентов, которые оказываются неправомочными участвовать в обследовании

после начала проведения интервью. Рекомендуется, чтобы страны оценили долю тех

респондентов, которые были выбраны из реестра и действительно имеют право отвечать на

вопросы обследования GATS (e), используя взвешенные частоты кода расположения, как:

[ ] [ ] [ ] [ ] [ ][ ] [ ] [ ] [ ] [ ] [ ]

11 12 15 16 17

11 12 13 15 16 17person levele − + + + +

=+ + + + +

(24)

Если эта доля для выборки в целом менее 0.90, странам следует откорректировать

компонент отдельных лиц с неизвестной правомочностью уровня ответов отдельных лиц путем

умножения числа отдельных лиц неизвестной правомочности (окончательный код расположения

14) на коэффициент (e). Следующая формула соответствует вычислению уровня ответов RR3

согласно AAPOR (2009):

Уровень ответов отдельных лиц = [ ]

[ ] [ ] [ ] [ ] [ ] [ ]11

Person-level response rate11 12 14 15 16 17person levele −

= + + + + + (25)

Компонент корректировки уровня отдельных лиц ( ( nr , person )hjA ) корректировки взвешивания

для j-ного человека в i-ном домохозяйстве будет вычисляться, как единица, деленная на

взвешенный уровень ответов отдельных лиц.

Page 24: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-10 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

Корректировки, основанные на небольшой подгруппе

или кластеров небольших размеров, могут страдать

значительной изменчивостью и дают слишком большие

значения корректировочных коэффициентов. Поэтому будет

установлена верхняя граница 3.00 для всех вычисляемых

корректировочных коэффициентов взвешивания подгрупп

уровня домохозяйств и отдельных лиц. Значения более 3.00

в любом компоненте корректировочного коэффициента

будет зафиксировано на уровне 3.00.

Наконец, соответствующий компонент уровня домохозяйств ( ( nr , HH )hiA ) и компонент уровня

отдельных лиц ( ( nr , person )hjA ) корректировки для j-ного человека в i-ном домохозяйстве должны быть

умножены для получения комбинированного коэффициента корректировки на уровень неполучения ответа для этого респондента ( ( )).

Выбор характеристик для определения подгрупп (т.е.

“классов” взвешивания) для каждого компонента является

стратегически важным, так как сокращение отклонения,

связанное с данным подходом, напрямую связано со

степенью корреляции между уровнем ответов и

интересующим параметром для этих классов (Kalton, 1983).

Взвешиваемые подгруппы в большинстве случаев

определяются путем перекрестной классификации

нескольких категориальных переменных (например,

классифицированные непрерывные переменные, такие как

возраст, который был разделен на несколько категорий,

определенных как возрастные подгруппы). Этими

подгруппами могут быть слои выборки, кластеры выборки,

или подгруппы, определяемые другой известной информацией по всем выбранным членам

выборки. Для выборок GATS, мы рекомендуем, чтобы подгруппы взвешивания для компонента

уровня домохозяйств коэффициента на неполучения ответов определялись набором выбранных

домохозяйств в рамках “сегментов” выборки. Для тех стран, которые выбрали географические

кластеры для прямого перечисления домохозяйств одним этапом, первичные единицы выборки

(PSU) будут подгруппами взвешивания для компонента уровня домохозяйств. Для компоненты

уровня отдельных лиц коэффициента корректировки на неполучение ответов мы рекомендуем,

чтобы подгруппы взвешивания отдельно определялись для каждого региона, по которому

требуются оценки обследования GATS и 8,000 (4000 в зависимости от обстоятельств)

респондентов. Кроме того, для региона комбинация или все следующие переменные подгрупп

взвешивания уровня отдельных лиц должны использоваться для корректировки:

городской/сельский, сообщаемый в реестре возраст (15-24, 25-34, 35-44, 45-54, 55+), пол (мужской,

женский) и текущий статус относительно курения (курящий, некурящий). В случае, если

региональные оценки делаться не будут, подгруппы взвешивания компонента уровня отдельных

лиц могут быть сформированы путем сочетания переменных городской/сельский, пол, возраст и

статус относительно курения.

РЕКОМЕНДАЦИЯ:

Любой компонент корректировочного

коэффициента уровня домохозяйств

или отдельных лиц на неполучение

ответов, который превышает 3.00,

должен быть определен, как равный

3.00.

РЕКОМЕНДАЦИЯ:

Формируйте ячейки подгрупп

взвешивания для компонента уровня

отдельных лиц корректировочного

коэффициента на неполучение

ответов по сообщаемому в реестре

полу, возрасту и текущему статусу

относительно курения; а также по

регионам, если нужны качественные

региональные оценки.

Page 25: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-11 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

После того, как подгруппы взвешивания были сформированы по каждому компоненту, две

мультипликативных составляющих корректировочного коэффициента взвешивания подгрупп для GATS будут вычисляться для респондента R следующим образом. Числителями и знаменателями

в приведенных ниже примерах являются суммы базовых весов. Для компонента уровня домохозяйств, если все из H α • = 5 6 выбранных домохозяйств в thα − -ной первичной единице

выборки (PSU), в которой расположено домохозяйство респондента R являются правомочными

для участия в обследовании, и сумма базовых весов этих домохозяйств составляет 170,013.3, и ( HH )rα• = 50 из них согласились принять участие в обследовании (взвешенное общее количество

среди них = 156,261.9), тогда компонент уровня домохозяйств взвешенной корректировки на

неполучение ответа будет вычисляться исходя из опыта взвешенного уровня ответов для выборки

выбранных домохозяйств в PSU или сегменте, в котором расположено домохозяйство респондента R. Для этого примера, предположим, мы обнаружили, что eуровня домохозяйств

превышает 90%, что позволяет нам использовать приведенную выше формулу 20. Взвешенный уровень ответов домохозяйств подгруппы взвешивания для респондента R (проживающего в i-ном

домохозяйстве) составляет

( , ) = ( , ) = ∑ ∝.( ) ∑ ∝. = , ., . = 0.9191 (26)

Компонент уровня домохозяйств корректировочного коэффициента взвешивания подгрупп для респондента R (проживающего в i-ном домохозяйстве) тогда будет вычисляться, как

( , ) = ( , ) = ∑ ∝.( ) ∑ ∝. = . = 1.088 (27)

где hiB являются переменными базовых весов для домохозяйств в рамках h-ной подгруппы

взвешивания.

Если менее 90% домохозяйств, предоставляющих информацию о правомочности, были

выявлены, как имеющие право принимать участие в обследовании GATS по всей стране,

компонент домохозяйств неизвестной правомочности умножается на (e) и получаются немного

более высокие уровни ответов и соответственно более низкие корректировки показателей

домохозяйств.

Компонент корректировки уровня домохозяйств (1.088) менее 3.00, так что нет

необходимости ограничивать величину коэффициента корректировки.

Взвешенный уровень ответов уровня отдельных лиц должен быть вычислен с помощью

приведенной выше формулы (23), если коэффициент (e) выбранных лиц, которые имеют право

заполнять вопросник GATS равен 0.90 или более. Если (e) менее 0.90, должна использоваться

формула (25) для вычисления уровня ответов отдельных лиц. Как и в случае компонента

корректировочного коэффициента уровня домохозяйств, компонент корректировки уровня отдельных лиц для респондента R равен единице, деленной на взвешенный уровень ответов для

подгруппы взвешивания респондента R. Теперь предположим, что респондент R является

городской жительницей, курящей женщиной в регионе X, и она одна из hr 680= респондентов

Page 26: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-12 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

(взвешенное количество=119,009,025) среди жителей hn 771= домохозяйств (взвешенное

значение= 134,935,233) подгруппы взвешивания уровня отдельных лиц, состоящей из жителей

всех выбранных домохозяйств региона X, которые являются городскими жителями, женщинами и

курящими на данный момент. Предположим, кроме того, что взвешенный уровень ответов для подгруппы взвешивания респондента R составляет

( , ) = ( , ) = ∑ ∑ = , ,, , = 0.8820 (28)

Компонент уровня отдельных лиц корректировочного коэффициента для респондента R ,

таким образом, вычисляется, как

( , ) = ( , ) = ∑ ∑ = . = 1.1338 (29)

Компонент уровня отдельных лиц корректировочного коэффициента также менее 3.00,

поэтому не требуется ограничивать его значение. Окончательный коэффициент корректировки на неполучение ответов для респондента R составляет

( ) = ( ) = ( , ) ( , ) = ( , ) ( , ) = [1.0880]. [1.1338] = 1.2336 (30)

Взяв величину базового веса и окончательный коэффициент корректировки на неполучение ответов для респондента R, откорректированный на неполучения ответов вес в выборке

респондента R вычисляется, как

( ) = . ( ) = [12501.3081]. [1.2336] = 15421.61 (31)

3.3 Корректировка путем пост-стратификационной калибровки

Необходимо для выполнения этого вычислительного шага:

• Численность населения по данным переписи населения, проведенной в период 5 лет до

времени проведения интервью или другого авторитетного источника данных о текущей

численности населения, лиц в возрасте 15 лет и старше в общем, по категориальным

переменным, относящимся к поведению в плане курения, и остающемуся дисбалансу

выборки (например, охват). Возможные переменные калибровки включают в себя пол,

образование, возраст, городской/сельский житель и регион, если имеются в наличии

данные о численности населения регионов, и размеры выборок респондентов достаточно

велики на региональном уровне (рекомендуется 8 000) для получения качественных

региональных оценок.

• Сопоставимо сформулированные вопросы и категории ответов на вопрос о поле и

образовании респондента в вопроснике GATS.

• Веса, откорректированные на неполучение ответов ( ( )) для всех респондентов

выборки

Page 27: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-13 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

Вычисление пост-стратификационных корректировок с наглядным примером:

В то время, как два типа корректировок на неполучение ответов, которые были только что

описаны, являются эффективными для компенсации дисбаланса выборки, возникающего из-за

переменных, которые используются для определения подгрупп взвешивания и модели

склонностей к ответу, могут существовать и другие важные характеристики выборки, по которым

корректировка не проводилась. Например, могут существовать дополнительные характеристики

отобранной выборки, по которым наблюдаются различные уровни ответов. Также, могут

существовать характеристики населения, по которым имеется различный уровень охвата рамками

обследования, и могут быть различия в размере отобранной выборки по характеристикам,

отличающимся от тех, по которым производилась стратификация процесса отбора выборки.

Обычным решением компенсации этого остающегося дисбаланса является последующая

калибровка выборки, но на этот раз по характеристикам населения из которого эта выборка была

сделана.

Deville and Sarndal (1992) были первыми, кто ввел в обиход термин “калибровка,” в

сочетании со взвешиванием выборки, но подходы ограничения весов существуют уже более 60

лет. В принципе, целью корректировки путем калибровки весов является привести взвешенные

суммы данных выборки в соответствие с аналогичными величинами в целевой группе населения.

Пост-стратификация и балансировка были важными ранними формами калибровки весов, и можно

сказать, являются отдельными способами применения общей схемы калибровки, описанной Deville

and Sarndal (1992). Оба способа используются до сих пор.

Роль калибровки зависит от того, какие другие корректировки, если таковые имеются,

проводятся и оттого, в каком порядке они проводятся. Например, когда порядок проведения всего

трех корректировок состоит в корректировках на неполучение ответов и затем калибровка, тогда

калибровка корректирует любые дисбалансы выборки, которые не были исправлены

корректировкой на неполучение ответов. С другой стороны, если применение коррекции только

путем калибровки является практичным, она становится единственным средством устранения

дисбалансов выборки всех видов.

Окончательный набор весов может быть откалиброван в соответствии с распределением

населения на основе демографических данных из статистически высшего внешнего источника

(например, последней переписи населения или выводов другого современного национального

обследования с оценками численности населения равного или более высокого качества).

Солидные и общепринятые демографические прогнозы могут быть также использованы в качестве

объекта калибровки. В случае, если последняя перепись населения была сделана пять или более

лет назад относительно даты сбора данных GATS, следует обдумать применение других

источников для корректировки данных. Страны, где не имеется или есть только устаревшие

источники для калибровки данных, могут быть не в состоянии выполнить этот корректировочный

шаг. В этом случае необходима консультация национальных координаторов и статистиков из

Комитета по рассмотрению выборки. Этот шаг, по существу, включает в себя корректировку

взвешенной выборки (на основе ( nr )jW из выборки GATS) в соответствии с распределением

населения с помощью набора категориальных переменных калибровки одним из двух способов: (1)

путем пост-стратификации (или взвешивания ячеек) по общему или перекрестно-

классифицированному распределению населения относительно этих переменных или (2) путем

балансировки (или повторяющегося пропорционального приведения в соответствие ) так, чтобы

Page 28: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-14 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

поля общего распределения переменных среди населения соответствовали населению. Хотя

различия в окончательных скорректированных весах,

вероятно, будет несколько ниже по сравнению с

балансировкой, относительно достаточно большие

ожидаемые размеры выборок GATS с большей готовностью

поддаются пост-стратификации, которая точнее калибрует

выборку соответственно населению и, следовательно,

является рекомендуемым подходом калибровки для

обследования GATS. Подробные инструкции по

использованию пост-стратификации приведены ниже.

Статистики страны, заинтересованные в использовании

процедур балансировки, должны обратиться к координатору

страны и в Комитет по рассмотрению выборки(SRC) пред

тем, как приступить к работе.

Как и при проведении других корректировок,

калибровка является наиболее эффективной, когда

переменные, используемые для определения контрольных

распределений, тесно связаны с ключевыми переменными

исследования. Хотя лучший набор предикторов часто

меняется в зависимости от переменных обследования в

исследованиях, связанных с вопросами здоровья, пол и

образование являются, как правило, хорошими предикторами поведения относительно

употребления табака и, таким образом, являются хорошим вариантом для выборок GATS.

Возраст, сельское/городское местожительство и регион, если размеры выборки достаточны для

получения региональных оценок, также, являются потенциальными переменными для калибровки.

Переменная сельское/городское местожительство должна заменить переменную образование при

определении ячеек корректировки при калибровке, когда сравнения по критерию городской-

сельский считаются более важными, чем преимущества калибровки по критерию образования, как предиктору употребления табака. В конечном счете, окончательный анализируемый вес ( jW ) для

j -ной записи данных респондента получается из уравнения (1) ( nr ) (cov) ( cal )j j j j jW B A A A= , где ( )

вычисляется по определенной стратегии калибровки. Обратите внимание, что (cov)jA 1= , так как

никаких специальных корректировок не рекомендуется проводить относительно охвата рамками.

Пост-стратификация для калибровки окончательных весов GATS должна осуществляться

следующим образом. Во-первых, должны быть определены корректировочные ячейки путем

перекрестной классификации нескольких категориальных (или сгруппированных) переменных

калибровки, о которых, как правило, известно, что они коррелируют с ключевыми измерениями

употребления табака, которые будут сообщаться по выборкам GATS. Как указывалось ранее,

предикторы переменные, которые мы рекомендуем (как минимум) для калибровки выборки GATS

включают в себя пол респондента (мужчина или женщина) и четыре категории уровня

законченного официального образования респондента. Категории образования должны быть

определены так, чтобы предельное процентное распределение среди категорий было как можно

ближе к равномерному распределению (т.е., приблизительно 25% населения в каждой группе по

данным переписи населения или другого статистически превосходящего внешнего источника).

РЕКОМЕНДАЦИЯ:

Формируйте корректировочные

ячейки для пост-стратификации по

сообщенным респондентом данным

о поле, возрасте и образовании;

также по региону, если необходимы

качественные региональные оценки.

Переменная сельское/городское

местожительство должна заменить

переменную образование при

определении ячеек корректировки

при калибровке, когда сравнения по

критерию городской-сельский

считаются более важными, чем

преимущества калибровки по

критерию образования, как

предиктору употребления табака.

Page 29: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-15 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

Возвращаясь к нашему примеру калькуляции весов для вымышленного респондента GATS, R, который будет отнесен к корректировочной ячейке калибровки, включающей тех в регионе X,

кто также является женщиной и находится в той же категории по уровню образования, как и респондент R. Если количество членов населения с такими характеристиками на основании

данных последней переписи значится, как hN 2,724,182= , и взвешенная сумма выборки с такими

характеристиками составляет, hr

( nc )hj

j 1W 2,919,669.3442

=

= , тогда пост-стратификационная

корректировка ( ( )) вычисляется для респондента R и всех других респондентов GATS в

корректировочной ячейке калибровки респондента R , как

( ) = ∑ ( ) = , ,, , . = 0.9330, (32)

где hN количество членов населения с такими характеристиками согласно внешнему источнику

данных о численности населения, таким образом, H

hh 1

N N=

= это общее количество населения,

как указано во внешнем источнике калибровки, и hr размер выборки респондента в

корректировочной ячейке. Обратите внимание, что ( ) является одинаковым для всех

респондентов в корректировочной ячейке ‘h’. При проверке набора корректировок ( ( )) среди

всех корректировочных ячеек в заключении этого шага, вы должны увидеть, что большинство из

них либо немного больше, либо немного меньше 1, где те сегменты населения, которые остались

недостаточно представленными в выборке после корректировки на неполучение ответов, имеют

значения более единицы, и те, которые чрезмерно представлены, имеют значения менее

единицы.

Умножая существующий вес респондента R на корректировочный коэффициент для

корректировочной ячейки респондента R ( ( )), окончательный откорректированный вес для

респондента R (который добавляется к записи данных респондента R в файле анализа) будет,

= ( ). ( ) = 15421.61 . 0.9339 = 14402.24 (33)

и взвешенная относительная частота распределения выборки и использованием этого

окончательного веса теперь совпадает с соответствующим распределением населения

относительно переменных калибровки; т.е.,

= = =

= h hr rH

hj hj hj 1 h 1 j 1

W / W N / N . (34)

Это равенство может быть использовано в качестве проверки расчетов по этой корректировке.

Альтернативный подход:

В странах с небольшими размерами выборки респондентов и более непропорциональной

выборкой по регионам, балансировка может быть более практичной альтернативой пост-

стратификации. Балансировка для приведения сумм окончательных откорректированных весов в

Page 30: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 3-16 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 3: Рекомендуемый подход

соответствие с предельными категориальными общими величинами по набору переменных

калибровки (но не по кросс-класс ячейкам) была впервые предложена Deming и Stephan (1940).

Начиная с того же типа многоходовой конфигурации категориальных переменных калибровки как и

в пост-стратификации, при каждом повторении балансировки задействуются отдельные

категориальные суммы для приведения в соответствие по каждой переменной к равным

соответствующим общим величинам населения данной категории (см. Kalton и Flores-Cervantes,

2003 где приведен пример вычисления в этом случае с двумя калибровочными переменными).

Страны, заинтересованные в использовании балансировки, а не пост-стратификации для

калибровки окончательных весов GATS должны обсудить этот вариант с национальным

координатором своей страны и Комитетом по рассмотрению выборки (SRC).

Page 31: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 4-1 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 4: Обеспечение качества

весов выборки GATS

4. Обеспечение качества весов выборки GATS

Чтобы гарантировать, что веса выборки GATS вычисляются последовательно и точно в

каждой стране, у нас есть несколько предложений относительно обеспечения этого в заключение

этого руководства.

Тщательно документируйте отбор выборки и соответствующие вероятности

Важность тщательного документирования процесса отбора на каждом этапе выборки

процесса выборки GATS не может быть переоценена. Поэтому крайне важно, чтобы технический

персонал в каждой стране GATS взял на себя строгие обязательства по ведению данной

документации. Есть несколько способов обеспечения того, чтобы эта документация была полной и

в полном объеме использовалась для вычисления весов. Во-первых, после того, как определен

алгоритм отбора для каждого этапа, сотрудники должны обратиться к авторитетным источникам по

выборке, чтобы найти правильную формулу вычислений для используемой стратегии отбора.

Некоторыми часто используемыми стратегиями отбора для выборок обследований являются

простая случайная выборка, систематическая выборка, последовательная случайная выборка,

ВПР систематическая выборка, ВПР выборка без замен и ВПР выборка с заменами. Источниками

для консультирования могут быть работы Hansen, Hurwitz, и Madow (1953), Kish (1965), Raj (1968),

Cochran (1977), Sukhatme, et al., (1984), и Lohr (1999). Во-вторых, средства для вычисления этих

вероятностей выбора должны быть готовы, чтобы провести правильные вычисления после

осуществления выбора. В практическом смысле это означает, что компьютеризированный выбор

предпочтительней выбору, сделанному вручную, и что компьютерный код для отбора выборки

должен также включать шаги по вычислению и хранению вероятностей выбора в то же самое

время, когда выбираются отдельные члены выборки. Это также означает, что если какие-либо

этапы выборки должны осуществляться вручную, формы, используемые для произведения

выборки, должны обеспечивать то, чтобы вся информация необходимая для расчета вероятности

выбора для этого этапа могла быть получена в тоже время, или позже, если это является более

предпочтительным. В третьих, на технический персонал внутри страны должна быть возложена

общая ответственность, чтобы гарантировать, что вероятности выбора вычисляются правильно,

своевременно, и надлежащим образом сохраняются для использования, когда придет время

расчета весов. В-четвертых, процедуры и формулы, используемые для расчета всех компонентов

весов выборки, должны быть спланированы и достаточно подробно задокументированы заранее

до процесса расчета весов так, чтобы другой компетентный член технического персонала, не

работающий с GATS, мог правильно провести процесс вычисления весов. Этот подготовленный

для страны набор планируемых характеристик вычисления весов GATS должен быть

модифицирован при завершении процесса вычисления весов, чтобы служить в качестве

окончательной документации по весам GATS. И, наконец, документация по процессу взвешивания

должна быть сделана общедоступной для партнеров GATS и Комитета по рассмотрению выборки.

Контролируйте негативный статистический эффект отклонения весов

Kish (1965) показал, что отклонение весов выборки может увеличить вариантность оценок

обследования на коэффициент мультипликативного эффекта (Meff). Например, если w 12394.0091= есть среднее окончательных откорректированных весов выборки jW , и

Page 32: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 4-2 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 4: Обеспечение качества

весов выборки GATS

( )22Ws 5463.3760= есть вариантность этих же самых весов среди членов выборки GATS, частью

которой является вымышленный респондент R, тогда

22W

w 2

s 5463.3760Meff 1 1 1.1943w 12394.0091

= + = + = (35)

Некоторыми факторами, способствующими этой вариации, являются особенности схемы

выборки, предназначенные для сокращения вариантности оценок (например, распределение

выборки среди слоев), тогда как другие являются результатом стратегий по контролю смещений в

этих оценках (например, корректировки на неполучение ответов и калибровка выборки).

Эффективный контроль этих отклонений требует определения четкого пути между сокращением

негативного эффекта wMeff на точность оценок, в тоже время, сводя к минимуму изменение в

преимуществах сокращения смещения корректировки весов.

Рекомендуемым подходом работы над эффектом

отклонения весов для выборок GATS будет состоять в том,

чтобы контролировать wMeff для окончательных

откорректированных весов ( jW ), и консультироваться с

центральным персоналом GATS, если wMeff 2.00> . Эти

консультации могут привести к использованию различных

существующих стратегий (например, отсечение весов) для

ограничения размера корректировки весов или

использование различных стратегий “обрезки” веса.

Например, Kalton и Flores-Cervantes (2003) описывают процесс дальнейшего уменьшения

корректировочных ячеек, чтобы ограничить размер корректировок, производимых окончательным

набором ячеек. Этот превентивный подход может быть использован для контроля за размером

корректировок на неполучение ответов, но может также применяться для ограничения размеров

корректировок калибровки в качестве золотой середины между пост-стратификацией и

балансировкой (см. Deville и Sarndal, 1992). Potter (1988; 1990; 1993), с другой стороны,

рассматривает несколько подходов обрезки, при которых создается несколько наборов

обрезанных весов на основе различных уровней обрезки, и затем выбирается набор обрезанных

весов с минимальной оценочной среднеквадратичной ошибкой для ключевых оценок

обследования. Недостатком является то, что обрезанные веса, которые дают минимальную

оценочную среднеквадратичную ошибку для одной оценки обследования, могут не давать такого

же результата для другой оценки.

Тщательно следуйте вычислительным процедурам и проверкам качества,

рекомендованным в данном руководстве

Целью данного пособия является предоставление руководства в разработке стратегии

вычисления весов в каждой выборке GATS и обеспечение того, что данная стратегия может быть

успешно выполнена так, чтобы аналитики данных GATS могли быть уверены, что веса, которые

они используют, будут способствовать получению наилучших оценок употребления табака

населением. Чтобы помочь достигнуть этой цели, мы предоставили набор конкретных процедур,

следуя которым можно получить веса выборки для данных GATS, которые отвечают самым

РЕКОМЕНДАЦИЯ:

Контролируйте эффект отклонения

весов путем мониторинга его

мультипликативного эффекта на

вариантность оценок обследования;

консультируйтесь со специалистами

GATS по мере необходимости

Page 33: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 4-3 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 4: Обеспечение качества

весов выборки GATS

высоким стандартам в области научных исследований, и если все страны GATS будут им

одинаково тщательно следовать, это будет способствовать проведению качественных сравнений

выводов обследований разных стран. При описании вычислительных шагов для получения весов,

мы также предложили или подразумевали пути обеспечения качества весов выборки. Они состоят

в следующем:

a. Попросите кого-нибудь, кто не участвует в вычислении весов GATS, но знаком с

содержанием рекомендованного протокола, изложенного в данном руководстве,

проверить работу тех, кто производит веса в процессе вычислений. Такая проверка

лучше всего может быть сделана после завершения каждого шага (т.е. вычисление

базовых весов, вычисление корректировки на неполучение ответов и вычисление

корректировки калибровки), а не один раз по окончании всего процесса.

b. Определите, является ли средний размер базовых весов ( jB ), поделенный на средний

размер весов откорректированных на неполучение ответов ( ( )) приблизительно

равным окончательному общему уровню ответовl RR1, как описано в Разделе 3.2 этого

руководства.

c. Используйте уравнение (34), чтобы подтвердить, что взвешенное распределение с

использованием окончательных откалиброванных весов ( jW ) соответствует (по каждой

корректировочной ячейке калибровкиl) распределению населения, относительно которого

производилась калибровка весов.

d. Обратите внимание, что сумма окончательных откорректированных весов ( jW ) всей

выборки должна совпадать по размеру с общей численностью населения (людей в

возрасте 15 лет и старше) указанной в источнике, использованном для калибровки. Если

таким источником была последняя перепись населения, тогда сумма весов должна

совпадать с численностью населения по последней переписи.

e. Подтвердите, что корректировки после стратификации ( ( )), производимые по набору

корректировочных ячеек, в основном, немного больше или меньше 1.

Подготовьте подробный письменный документ, описывающий процесс вычисления весов,

который проводился в действительности

Как и в большинстве видов деятельности обследования, которые планируются, а затем

выполняются, изложенный план (т.е., по существу содержание этого руководства, если

выполняется рекомендуемый процесс вычисления весов)

часто несколько отличается от того, что выполняется на

самом деле. Отход от запланированных характеристик

может произойти при производстве весов на каждом из трех

шагов вычисления весов. Например, если используется

другой авторитетный метод выбора респондента

обследования в рамках домохозяйства, тогда вычисление

условной вероятности выбора респондента из участвующего

в GATS домохозяйства будет вычисляться в соответствии с

этим другим методом. Во избежание потери детальной информации об этой важной деятельности,

происходящей до анализа GATS, подробное письменное документирование реального процесса

взвешивания, в основном, изложенное в соответствии с планом этого руководства, должно быть

РЕКОМЕНДАЦИЯ:

Следуйте рекомендованным шагам

по взвешиванию и выполняйте

предлагаемые проверки во время

вычислений

Page 34: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 4-4 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 4: Обеспечение качества

весов выборки GATS

завершено сразу после расчета весов, а затем этот документ должен стать неотъемлемой частью

документации для всех видов деятельности обследования GATS. Этот документ будет

использоваться для проведения официальной оценки процесса взвешивания и калибровки био

статистиками Комитета по рассмотрению выборки SRU и, в конечном итоге, будет включен в

окончательный страновой отчет каждой страны в качестве свидетельства о методах,

использованных при проведении обследования GATS. Более подробную информацию о формате

и конкретных вычислениях, необходимых для рассмотрения см. пособие GATS Обеспечение

качества: руководство и документация. Публичный выпуск взвешенных выводов данных

страны не должен происходить до того, как документация рассмотрена и официально

сертифицирована, как соответствующая стандартам качества определения весов, как указано в

данном руководстве.

Консультируйтесь с персоналом центрального офиса GATS по вопросам, возникающим в

ходе процесса взвешивания

Наконец, сотрудники центрального офиса GATS готовы

оказывать поддержку процессу расчета весов выборки в каждой

стране GATS. Эта поддержка будет включать в себя

разъяснение процессуальных методов, изложенных в данном

руководстве, а также помощь в устранении ошибок при

непредвиденных процессах при выполнении этих важных задач

обследования.

РЕКОМЕНДАЦИЯ:

Подготовьте письменный документ,

в котором дается детальная

информация о том, как были

рассчитаны веса для страны GATS

Page 35: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 5-1 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 5: Библиография

5. Библиография

American Association for Public Opinion Research. 2009. Standard Definitions: Final Dispositions of Case Codes and Outcome Rates for Surveys. 6th edition. AAPOR.

Berry, C. C., Flatt, S. W., and Pierce, J. P. (1996). Correcting Unit Nonresponse via Response Modeling and Raking in the California Tobacco Survey. Journal of Official Statistics, 12(4), 349-363.

Cochran, W.G. (1977). Sampling Techniques, 3rd Ed., New York: Wiley and Sons.

Deming, W. E. and Stephan, F. F. (1940). On the Least Squares Adjustment of a Sample Frequency Table When the Expected Marginal Totals are Known. Annals of Mathematical Statistics, 11(4), 427-444.

Deville, J. C. and Sarndal, C. E. (1992). Calibration Estimators in Survey Sampling. Journal of American Statistics Association, 87, 376-382.

Global Adult Tobacco Survey Collaborative Group. Global Adult Tobacco Survey (GATS): Sample Design Manual, Version 2.0. Atlanta, GA: Centers for Disease Control and Prevention, 2010.

Global Adult Tobacco Survey Collaborative Group. Global Adult Tobacco Survey (GATS): Field Interviewer Manual, Version 2.0. Atlanta, GA: Centers for Disease Control and Prevention, 2010.

Global Adult Tobacco Survey Collaborative Group. Global Adult Tobacco Survey (GATS): Field Supervisor Manual, Version 2.0. Atlanta, GA: Centers for Disease Control and Prevention, 2010.

Global Adult Tobacco Survey Collaborative Group. Global Adult Tobacco Survey (GATS): Quality Assurance: Guidelines and Documentation, Version 2.0. Atlanta, GA: Centers for Disease Control and Prevention, 2010.

Hansen, M.H., Hurwitz, W.N., and Madow, W.G. (1953). Sample Survey Methods and Theory, Vols. I and II, 1953.

Horvitz, D. G. and Thompson, D. J. (1952). A generalization of sampling without replacement from a finite universe. Journal of the American Statistical Association, 47, 663-685.

Iannacchione, V. G., Milne, J. G., and Folsom, R. E. (1991). Response Probability Weight Adjustments Using Logistic Regression. Proceedings of the Section on Survey Research Methods, American Statistical Association, 637-642.

Kalsbeek, W. D., Morris, C., and Vaughn, B. (2001). Effects of Nonresponse on the Mean Squared Error of Estimates from a Longitudinal Study. Proceedings of the Section on Survey Research Methods, American Statistical Association

Kalton, G. (1983). Compensating for Missing Survey Data. Ann Arbor, MI: University of Michigan.

Kalton, G. and Flores-Cervantes, I. (2003). Weighting Methods. Journal of Official Statistics, 19(2), 81-97.

Kish, L. (1965). Survey Sampling, Second Printing, New York: Wiley and Sons.

Lepkowski, J. M., Kalton, G., and Kasprzyk, D. (1989). Weighting Adjustments for Partial Nonresponse in the 1984 SIPP Panel. Proceedings of the Section on Survey Research Methods, American Statistical Association, 296-301.

Lessler, J. T. and Kalsbeek, W. D. (1992). Nonsampling Error in Surveys. New York: Wiley and Sons.

Lohr, S. (1999). Sampling: Design and Analysis, Pacific Grove: Duxbury Press.

Potter, F. J. (1988). Survey of Procedures to Control Extreme Sampling Weights. Proceedings of the Section on Survey Research Methods, American Statistical Association, 453-458.

Potter, F. J. (1990). A study of procedures to identify and trim extreme sampling weights. Proceedings of the Section on Survey Research Methods, American Statistical Association, 225-230.

Potter, F. J. (1993). The Effect of Weight Trimming on Nonlinear Survey Estimates. Proceedings of the Section on Survey Research Methods, American Statistical Association, 758-763.

Raj, D. (1968). Sampling Theory, New York: McGraw-Hill.

Särndal, C.-E., Swensson, B., and Wretman, J. H. a. (1992). Model assisted survey sampling. New York: Springer-Verlag.

Sukhatme, P. V. et al, (1984). Sampling Theory of Surveys with Applications, Ames: Iowa State University Press.

Page 36: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

Глобальное обследование употребления табака среди взрослых (GATS) 5-2 Руководство по взвешиванию выборки

Редакция 2.0 — ноябрь 2010 г. Глава 5: Библиография

Page 37: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без
Page 38: GTSS Global Adult Tobacco Survey (GATS) · особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без

GLOBAL TOBACCO SURVEILLANCE SYSTEM (GTSS)