Ошибки при сборе данных

Наука » Маркетинг » Маркетинговые исследования

При сборе данных главная проблема – проблема ошибок. Различные виды ошибок представлены на рис. Рис. 14.

Ошибки при сборе данных

Рис. 14. Виды ошибок при сборе данных

Ошибки выборки (ошибки репрезентативности) обусловлены зависимостью результата от тех исследуемых единиц, которые попали в выборку. Из-за наличия этих ошибок при повторных выборочных наблюдениях наблюдаемые переменные будут, скорее всего, иметь другое значение. Хотя эти ошибки обычно уменьшаются с увеличением размера выборки, саму выборку следует тщательно планировать и проводить. Было показано, что неправильно организованная процедура выборки может привести к искажению получаемых результатов.

Ошибки, не связанные с выборкой (они могут быть в десятки раз больше первых!) подразделяются на случайные и неслучайные.

Случайные ошибки имеют различный знак, так что их общий итог равен нулю при достаточном объеме выборки. Неслучайные ошибки дают смещение суммарной оценки.

Спектр неслучайных ошибок очень широк. Они могут быть обусловлены ошибочными концепциями, неправильной логикой рассуждений, неправильной интерпретацией ответов, некорректным определением статистики, ошибками в арифметике, при табуляции, при кодировании, ошибками в отчете. Эти ошибки могут увеличиваться с увеличением выборки.

Неслучайные ошибки, в свою очередь, подразделяются на ошибки ненаблюдения (когда нельзя получить данные из-за неохвата исследуемых элементов или неответа респондентов) и ошибки наблюдения (когда были получены неточные данные или произошли ошибки в их обработке).

Для снижения ошибок применяют следующие общие меры.

q Валидность исследования проверяется с помощью достоверной информации, не содержащей отклонений. Например, собранную демографическую информацию можно сравнить с официальными данными переписи населения. Это, к сожалению, не всегда возможно.

q Для проверки состоятельности респондентов им задаются различные версии одного вопроса, и производится сравнение ответов.

q Состоятельность ответа проверяется повторным опросом того же человека через определенное время.

Ниже будут рассмотрены основные причины возникновения неслучайных ошибок и способы их уменьшения.

Неохват

В рамки выборки обычно попадает только часть генеральной совокупности. Если эти рамки выбраны неудачно, то не попавшие в них представляют собой группу, характеристики которой отличаются от средних по генеральной совокупности. Тогда исследование может дать неточные результаты.

Если опрос производится по карте, то на ней может не быть самых новых кварталов с особой категорией населения – новоселами. Неохват этой категории сильно исказит такую характеристику, как потребность населения в новой мебели и отделочных материалах. Значит, при проведении территориальной выборки следует пользоваться современными картами.

Обычно считается, что телефонные опросы дадут более или менее точную картину, только если уровень телефонизации интересующей исследователей части населения не ниже 50%. В настоящее время телефонизация в сельской местности России бывает значительно ниже.

Для снижения данного вида ошибок следует четко определить спецификации генеральной совокупности и рамок выборки, оценить репрезентативность множества элементов, попавших в рамки выборки.

Переохват

Переохват возникает, когда происходит дублирование элементов выборки, то есть когда имеется шанс исследовать один и тот же элемент дважды. Например, при проведении телефонных опросов со случайной генерацией номеров без повторений может оказаться, что одна семья будет опрошена дважды. Это случится, если в квартире стоит несколько телефонов.

Данный вид ошибок устраняется путем тщательного планирования выборки. Другой подход иллюстрируется следующим примером: при опросе владельцев машин о месте новой автозаправочной станции, владеющих двумя машинами берут с весом 0,5, так как их могли опросить в другом месте.

Отказ отвечать

46 исследовательских компаний в США провели в 1986 году специальное исследование по определению процента отказов давать ответы при опросах. Оно включало 1,4 млн. телефонных звонков и личных интервью. Отвечать отказалось 38% опрошенных. Из них 86% отказались еще до начала опроса или в самом его начале (во введении).

Процент отказов зависит от контингента респондентов, обстоятельств контакта, требуемой информации, поведения интервьюера.

Наименьшее количество отказов – при личном интервью, наибольшее – при почтовом опросе.

Для снижения уровня отказов используются следующие меры.

1. Повышение процента ответов при первичном опросе. Необходимо сказать о важности исследования, его целях, о гарантии анонимности, вознаграждении.

2. Уменьшение отказов в процессе работы. Если респондент плохо себя чувствует, устал или занят, то надо ему перезвонить в удобное для него время. Следует избегать скучных и сложных вопросов (и вообще тех, которые не являются жизненно необходимыми). Повторный опрос по почте будет, безусловно, означать для респондента потерю анонимности!

3. Экстраполяция. Пусть Xcp_o, Xcp_n – средние значения некоторой характеристики среди ответивших и не ответивших на некоторый вопрос. Тогда искомое среднее для всей выборки будет равно

Xcp=PoXcp_o+PnXcp_n,

где Po – доля ответивших на вопрос; Pn – доля отказавшихся отвечать; Po+Pn=1.

Неизвестное Xcp_n определяется по выборке из не ответивших с первого раза, со второго и т. д. (можно определить также среднее для каждой такой подгруппы).

4. Метод Политца и Симмонса – экстраполяция без перезванивания. Метод учитывает то, что если человек редко бывает дома, подобных ему в выборке будет мало. Поэтому у них должен быть большой вес.

При опросе у респондента спрашивают, был ли он дома в течение предыдущих пяти дней. Ответ взвешивается по вероятности присутствия дома. Если респондента не было дома все пять дней, то принимается, что доля таких респондентов в выборке 1/6, и вес ответа берется равным 6. Если респондент был дома каждый день, то вес ответа равен 1.

Неответ по позициям

Неответ по позициям может значительно снизить ценность собранной информации. Для снижения неответов по отдельным позициям анкеты требуется тщательно ее составить, проверить понятность вопроса, использовать меры по повышению процента ответов на деликатные вопросы.

В отчете обычно по каждому вопросу указывается процент тех, кто указал не знаю или вообще не дал никакого ответа. Иногда высокий процент неответов на какой-либо вопрос является важной информацией.

Ситуация с неответами по позициям несколько улучшается, если недостающие сведения могут быть хотя бы приближенно получены из других вопросов.



Источник: Н. В. Павлов, Санкт-Петербург, Издательство СПбГТУ, 2005
Авторское право на материал
Копирование материалов допускается только с указанием активной ссылки на статью!

Похожие статьи

Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.