Пусть из анкеты об удовлетворенности жизнью выбраны шесть вопросов: три о доме (Д1, Д2, Д3) и три о работе (Р1, Р2, Р3). Исходные данные находятся в таблице, строки которой соответствуют респондентам, а столбцы – их ответам, например, в процентах от полной удовлетворенности.
Пусть далее по ответам респондентов построена корреляционная матрица (табл. 5.19). В ней показаны корреляции между ответами на каждую пару вопросов.
Видно, что значения элементов этой матрицы различаются в несколько раз, причем некоторые имею довольно значительную величину (выделены рамкой). Наличие таких значений – простейший критерий применимости факторного анализа.
Поэтому определяются два фактора, что можно сделать стандартными методами. Как обычно, первый фактор «возьмет» максимальную дисперсию, а второй – максимум оставшейся. Каждый фактор будет представлять собой взвешенную сумму ответов на все вопросы.
Результат анализа будет полезным, если факторы удастся интерпретировать, выявить их смысл.
Рассчитав значения каждого из двух факторов для каждого респондента, следует рассмотреть корреляцию между переменными и полученными факторами (Табл. 5.20). Эти величины называются также факторными нагрузками и являются коэффициентами линейных уравнений, выражающих нормированные переменные через факторы. (Значения измеренных переменных для каждого элемента исследования может быть выражено как взвешенная сумма значений факторов для этого элемента. Эта операция обратна вычислению факторов в методе главных компонент). Полученные значения видны на графике в координатах {F1, F2}. (рис. 28).
Таблица 5.19
Корреляция между ответами на вопросы анкеты
|
Р1 |
Р2 |
Р3 |
Д1 |
Д2 |
Д3 |
Р1 |
1 |
|
|
|
|
|
Р2 |
0,65 |
1 |
|
|
|
|
Р3 |
0,65 |
0,73 |
1 |
|
|
|
Д1 |
0,14 |
0,14 |
0,16 |
1 |
|
|
Д2 |
0,15 |
0,18 |
0,24 |
0,66 |
1 |
|
Д3 |
0,14 |
0,24 |
0,25 |
0,59 |
0,73 |
1 |
Таблица 5.20
Корреляция между переменными и факторами
|
F1 |
F2 |
P1 |
0,65 |
0,56 |
P2 |
0,72 |
0,54 |
P3 |
0,51 |
0,74 |
Д1 |
0,63 |
-0,56 |
Д2 |
0,71 |
-0,57 |
Д3 |
0,61 |
-0,63 |
Рис. 28 . Корреляция между факторами и переменными
Видно, что одна группа точек получается в первом квадранте, другая – в четвертом. Если оси координат (факторы) повернуть, скажем, на угол около 45 градусов по часовой стрелке, то одна группа будет иметь большие значения F1’ и маленькие – F2’, другая – наоборот.
Способы вращения различны. На рис.28 показан способ, минимизирующий число переменных с высокими значениями факторных нагрузок. Цель такого вращения – получить факторы, связанные лишь с небольшим числом переменных. Из рисунка видно, что после вращения точки, соответствующие вопросам о работе, имеют большие нагрузки для фактора 2 и малые – для фактора 1. Для вопросов о доме наблюдается противоположная картина: большие нагрузки для фактора 1 и малые для фактора 2. Таким образом, фактор 1 интерпретируется как общая удовлетворенность жизнью дома, а фактор 2 – работой.
В итоге получилось, что за большим числом различных вопросов на разные темы выявилось малое число ранее скрытых факторов – обобщенных характеристик элементов исследования. Сами же вопросы сгруппировались по факторам: для фактора 1 используются вопросы Д1,Д2 и Д3, а для фактора 2 – вопросы Р1, Р2, Р3.
Если же вес некоторых вопросов в обоих факторах мал, то это – бесполезные вопросы и их можно убрать из анкеты. Наконец, возможен случай, когда вопрос имеет большой вес в обоих факторах. Такие вопросы также следует убрать.
Конечно, в приведенном примере вопросы были сразу разделены по смыслу (про дом, про работу). Но часто группировка вопрсов по факторам не столь очевидна. Например, в [21] приводится пример исследования того, на что обращают внимание покупатели автомобилей. Были выявлены такие обобщенные факторы, как экономия, удобство, рабочие характеристики, респектабельность. Другое исследование, приведенное в этой же книге, выявило такие обобщенные факторы, учитываемые при покупке зубной пасты, как защита зубов, их внешний вид.
Уточнение набора вопросов анкеты путем факторного анализа может производиться
q в психологических исследованиях (отношения, интересов, мнения, восприятия, предпочтения) в целях предсказания поведения людей как покупателей и потребителей;
q при группировке людей по схожести поведения.
q при определении атрибутов, которые определяют предпочтение продукта или марки;
q при определении наиболее «результативных» параметров рекламы;
q при исследовании стиля жизни.
Похожие статьи