С помощью простой табуляции выполняется целый ряд действий.
1. Обобщение результатов исследования. Результаты представляются в удобной и компактной форме.
2. Выявление ошибок. Они могут возникнуть при редактировании, кодировании, вводе данных в компьютер. Например, при сборе данных об объеме продаж по городам из одного города пришли странные данные. Выяснилось, что один из служащих со скуки приписал к данным пять нулей.
Данные лучше представлять в процентах, причем с точностью до целых. В исключительных случаях, если на то есть веские причины, можно вводить один знак после запятой. Хорошее представление: абсолютная величина и рядом, в скобках, процент.
3. Определение выбросов (посторонних значений). Выброс – не обязательно ошибка. Это просто измерение, сильно отличающееся от других. Обычно его убирают из общего анализа и исследуют его отдельно.
4. Определение эмпирического распределения переменной. Строится гистограмма, частотный полигон или функция распределения.
Пример полезности построения распределения – исследования мнений о предпочтительном вкусе кетчупа. Если часть респондентов на вопрос о пожеланиях к вкусу нового кетчупа отметила очень острый вкус, другая часть – очень мягкий, а число желающих умеренно острого кетчупа оказалось небольшим, то налицо сегментирование потребителей. Если сделать «средний» кетчуп, то он не понравится почти никому. Нужны два новых вида: острый и мягкий.
5. Получение суммарных статистик. По гистограмме легко можно получить моду, по функции распределения – медиану, квартили и процентили. По данным таблицы рассчитывается среднее и дисперсия (среднеквадратичное отклонение).
6. Решение вопроса, что делать с неответами по отдельным пунктам. Возможны следующие варианты:
q оставить неответ и отчитаться категорией нет ответа;
q для каждого вопроса указать, из скольких ответов получено среднее;
q заменить неответ медианой, модой или другой оценкой.
Похожие статьи