Регрессия с фиктивными переменными

Наука » Маркетинг » Маркетинговые исследования
Вернувшись к примеру о продаже шариковых ручек, рассмотрим оценку ответственного менеджера в баллах. Пусть уравнение регрессии имеет вид

Y=a1+b1x1+b2x2+b3x3


и отсутствует мультиколлинеарность. Пусть по методу наименьших квадратов получены значения b1=3, b2=0,5 и b3=10. Это означает, что увеличение количества торговых представителей на 1 увеличит объем продаж на 3, а увеличение на 1 количества рекламных обращений повысит объем продаж на 0,5. Кроме того, видно, что работа отличного менеджера (оценивается в 5 балла) отличается от работы хорошего (4 балла) на 10 единиц, работа хорошего и удовлетворительного (4 и 3 балла соответственно), удовлетворительного и плохого (3 и 2 балла соответственно) также отличаются на 10 единиц. В результате исходно лингвистическая шкала оценки получилась интервальной. Вдобавок получилось, что полное отсутствие ответственного менедера на 20 единиц хуже, чем присутствие плохого менеджера. Все это вызывает справедливые сомнения.

Для уточнения полученных выводов вводят фиктивные переменные. Они помогают работать с переменными, заданными в номинальных шкалах.

q Влияние пола вычисляется с помощью фиктивной переменной, принимающей значения 0 для мужчин и 1 для женщин. Затем эта фиктивная переменная включается в уравнение регрессии наравне с другими независимыми переменными. После нахождения коэффициентов bi коэффициент при этой фиктивной переменной будет отражать среднюю разницу величин зависимой переменной у мужчин и женщин.

q Уровень жизни, исходно оцениваемый словесно как высокий, средний и низкий, можно ввести в регрессионный анализ с помощью двух переменных, например, X10 и X11, присвоив им значения, соответственно 1 и 0 для высокого, 0 и 1 – для среднего и 0 и 0 – для низкого уровня жизни.

q Наконец, для оценки в баллах деловых качеств ответственного менеджера (см. пример) вместо одной переменной X3 требуется ввести три переменные, X4, X5 и X6, присвоив им значения 0, 0, 0 для плохой оценки, 1, 0, 0 – для средней, 0, 1, 0 для хорошей и 0, 0, 1 для отличной. В таблице исходных данных (см. табл. 5.19) удаляется столбец X3 и вводятся три столбца X4, X5 и X6. Значения этим переменным присваиваются в зависимости от значения X3 по приведенному выше правилу.

Количество фиктивных переменных равно количеству рассматриваемых ситуаций минус единица, все фиктивные переменные имеют значения 0 для одной из ситуаций, выбранной как «базовая».
Для каждой ситуации, кроме базовой, значение 1 имеет только одна переменная.


Уравнение регрессии превратилось в

Y=a1+b1x1+b2x2+b4x4+b5x5+b6x6


Оно решается стандартными методами. Пусть найдены значения b4=8, b5=22, b6=35. Это означает, что у удовлетворительного менеджера объем продаж на 8 единиц больше по сравнению с плохим. Действительно, для плохой оценки все значения X4, X5, X6 равны нулю, а для средней – только X4 равно 1. Поэтому b4 есть разница между городами с плохим и средним ответственным менеджером при прочих равных условиях.

Аналогично результаты хорошего менеджера отличаются от результатов плохого на 22, а отличного – на 35 единиц. Теперь получены уточненные значения влияния оценки менеджера по отношению к базовой – плохой. Теперь нетрудно определить различие между результатами отличного и хорошего, хорошего и удовлетворительного менеджеров. Коэффициент при ненулевой фиктивной переменной определяет разницу в значении функции между данной ситуацией и выбранной «базовой».


Источник: Н. В. Павлов, Санкт-Петербург, Издательство СПбГТУ, 2005
Авторское право на материал
Копирование материалов допускается только с указанием активной ссылки на статью!

Похожие статьи

Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.