简要说明使用虚拟编码时为何要将一个k水平的自变量用k一1个二分预测变量来替代而不是k个呢?

admin2018-10-20  38

问题 简要说明使用虚拟编码时为何要将一个k水平的自变量用k一1个二分预测变量来替代而不是k个呢?

选项

答案将两组人分别编码成0或1,这样的方法被叫作虚拟编码,称之为“虚拟”的原因是被赋予的数值没有意义,编码只是表示组别的不同。一般在引入虚拟变量时,要求每一定性变量个数比该定性变量的类别数少1,即若有k个水平的分类,则只在模型中引入k一1个虚拟变量。因为如果引入是个虚拟变量,会导致模型解释变量间出现完全共线性的情况,一般将由于引入虚拟变量个数与定性因素个数相同出现的模型无法估计的问题称为“虚拟变量陷阱”。

解析
转载请注明原文地址:https://jikaoti.com/ti/5UzjFFFM
0

随机试题
最新回复(0)