在Stata中进行因子分析时,核心命令为factor
,该命令通过提取公因子、旋转因子矩阵等方式,实现对多变量数据降维和潜在结构挖掘,以下是具体操作步骤及关键参数说明:

基本语法与数据准备
因子分析前需确保数据适合性,通常通过KMO检验(estat kmo
)和Bartlett球形检验(estat bartlett
)验证,基本语法为:
factor varlist [if] [in], [options]
其中varlist
为参与分析的原变量列表,常用选项包括:
factors(k)
:指定提取的因子数量(k为正整数)。pcf
:主成分法(默认),适用于数据降维;pfa
为主轴因子法,更适合探索潜在结构。rotate(method)
:旋转方法,如varimax
(正交旋转,因子不相关)、promax
(斜交旋转,因子允许相关)。mineigen(#)
:保留特征值大于#的因子(默认为1)。score
:保存因子得分,后续可通过predict
命令生成。
操作流程示例
以心理学量表数据为例,假设有6个测量变量(x1-x6),代码如下:
// 1. 数据预处理与检验 factor x1-x6, pcf mineigen(1) estat kmo // 检验KMO值(>0.6适合) estat bartlett // 检验显著性(p<0.05适合) // 2. 提取因子与旋转 factor x1-x6, pcf factors(2) rotate(varimax) loadingplot // 绘制因子载荷图 screeplot // 绘制碎石图辅助判断因子数 // 3. 保存因子得分 predict factor1 factor2, score
结果解读关键指标
- 因子载荷矩阵:展示变量与因子的相关性,绝对值越大关联越强(gt;0.4视为显著)。
- 共同度(Communality):
communal
选项可输出,反映变量被公因子解释的方差比例。 - 方差解释比例:
estat dimension
显示各因子贡献的累计方差,通常累计方差>60%较理想。
常见问题处理
- 因子数量确定:结合碎石图(拐点处)和特征值(>1)综合判断。
- 旋转方法选择:若理论假设因子独立,用
varimax
;若存在相关,用promax
或oblimin
。 - 变量筛选:若某变量共同度低(如<0.4),可考虑删除后重新分析。
相关问答FAQs
Q1: 因子分析中如何确定提取的因子数量?
A1: 可通过三种方法综合判断:①碎石图(Scree Plot),取曲线斜率变缓前的因子;②特征值准则(Kaiser准则),保留特征值>1的因子;③平行分析(paran
命令),比较实际特征值与随机数据特征值,保留大于随机值的因子,此外需结合理论意义,避免过度提取。

Q2: 因子得分如何解释与应用?
A2: 因子得分是各样本在公因子上的量化值,通过predict
命令生成,得分越高表示样本在该因子代表的潜维度上表现越强(如“焦虑因子”得分高说明焦虑水平高),应用时可将得分作为新变量纳入回归模型(如regress y factor1 factor2
),或用于聚类分析(cluster factor1 factor2
),需注意得分是标准化后的值(均值为0,标准差为1)。
