第 28 课:统计分析(四)探索性因子分析(EFA)
🎯 核心实操目标
通关要求:掌握 EFA 完整流程——KMO + Bartlett 前提检验 / 因子提取方法选择 / 因子旋转 / 载荷表解读 / 交叉载荷处理。本课你将用 Case A 的 AI 焦虑 12 题数据跑出符合理论预期的三因子结构(认知/情感/回避),并理解何时用 EFA 何时用 CFA。
📋 课前准备(5 分钟自检)
工具/账号
- [ ] Jamovi 2.5+(Factor 模块)
- [ ] 第 23 课清洗后数据,反向题已反转
数据/素材
- [ ] AI 焦虑 12 题(已反转 Anxiety_4_R)
- [ ] 样本量 N ≥ 200(EFA 经验法则:N ≥ 题数 × 10–20)
应急通道
- KMO < .60 → 数据不适合做 EFA,回头检查量表设计
- 跑不出预期维度 → 用 Promax 旋转替代 Varimax,或调整因子数
场景痛点破冰:什么是因子分析?
"用通俗话说: 你问卷有 12 道焦虑题,每个被试给出 12 个分数。 EFA 在干一件事: '这 12 个分数之间相关性高度纠缠, 它们其实可以归纳为几个「隐藏的大类」?'
想象 12 道题像 12 个分散的明星员工, EFA 找出他们暗中实际上归属于 3 个老板(认知/情感/回避)的管理体系。
KMO > 0.8 = '能成团'; 因子载荷 > 0.4 = '该员工确实归这个老板管'。"
🗺️ 架构重组:EFA 完整流程
Step 1: 前提检验 KMO ≥ .60 + Bartlett 球形检验 p < .05
↓
Step 2: 因子提取 主成分分析(PCA) 或 主轴因子(PAF)
↓
Step 3: 决定因子数 特征值 > 1 / 碎石图拐点 / 理论预期
↓
Step 4: 因子旋转 Varimax(正交) 或 Promax(斜交)
↓
Step 5: 载荷解读 载荷 > .4 才算"归属"
↓
Step 6: 交叉载荷处理 删题或归入高载荷因子🚀 拆解实战 A:Step 1 前提检验
Jamovi 操作
- Factor → Exploratory Factor Analysis
- Variables: 拖入 Anxiety 12 题(含反转后的 Anxiety_4_R)
- 在 Assumption Checks 中勾选:
- KMO measure of sampling adequacy
- Bartlett's test of sphericity
判断标准
| KMO | 评估 |
|---|---|
| ≥ .90 | 极好 |
| .80 – .89 | 很好(理想) |
| .70 – .79 | 中等 |
| .60 – .69 | 平庸(可勉强用) |
| < .60 | 不适合做 EFA |
Bartlett 球形检验:p < .05 → 可以做 EFA(说明变量间确实存在相关)
🚀 拆解实战 B:Step 2 因子提取方法
| 方法 | 适用 |
|---|---|
| 主成分分析(PCA) | 数据降维,不区分公共方差 vs 误差 |
| 主轴因子(PAF) | 假设存在公共潜变量,更符合心理学量表分析 |
| 最大似然(ML) | 需正态性假设,可做 CFA 衔接 |
Jamovi 默认主轴因子——心理学/教育学场景推荐。
🚀 拆解实战 C:Step 3 决定因子数
三种判断方法(建议综合使用):
① 特征值 > 1 法(Kaiser 准则)
每个特征值 > 1 的因子保留。 问题:常常高估因子数。
② 碎石图(Scree Plot)
寻找"拐点"(线条从陡降变平缓的点)。 最直观——拐点之前的因子数即为推荐数。
③ 理论预期
如果你的理论预设是 3 个维度,强行提取 3 个因子也合理。
💡 Case A 应该跑出 3 因子
Anxiety 12 题是按"认知/情感/回避"三维设计的, 理论 + 碎石图 + Kaiser 准则三者应该都指向 3 因子。
🚀 拆解实战 D:Step 4 因子旋转
| 方法 | 适用 |
|---|---|
| Varimax(正交旋转) | 假设因子间互相独立 |
| Promax(斜交旋转) | 允许因子间相关(心理学量表更常见,理论上推荐) |
实操建议:
- 先用 Varimax(结果干净直观)
- 如果各因子间理论上确实相关,再用 Promax 验证
🚀 拆解实战 E:Step 5–6 载荷表解读
Jamovi 操作
- 设置好提取方法 + 旋转 + 因子数
- 在 Factor Loadings 中勾选 Hide loadings below:
0.40 - 跑出旋转后载荷表
期望的清晰载荷模式(Case A)
═══════════════════════════════════════════════
Factor 1 Factor 2 Factor 3
(认知) (情感) (回避)
───────────────────────────────────────────────
Anxiety_1 .72 (认知)
Anxiety_2 .75 (认知)
Anxiety_3 .68 (认知)
Anxiety_4R .65 (认知反向)
Anxiety_5 .71 (情感)
Anxiety_6 .73 (情感)
Anxiety_7 .69 (情感)
Anxiety_8 .74 (情感)
Anxiety_9 .70 (回避)
Anxiety_10 .72 (回避)
Anxiety_11 .68 (回避)
Anxiety_12 .71 (回避)
───────────────────────────────────────────────
Variance % 16.2% 15.8% 14.5% 累计 46.5%
═══════════════════════════════════════════════交叉载荷处理
如果某题在两个因子上载荷都 > .40:
- 删除该题(最稳)
- 或保留在载荷更高的因子(差值 > .10 才能保留)
🚀 拆解实战 F:EFA vs CFA 选择
| 何时用 EFA | 何时用 CFA |
|---|---|
| 新编量表,没有先验维度假设 | 已有理论确定维度结构,要验证 |
| 跨文化适应(中国版 vs 美国版) | 重复别人量表,验证适配性 |
| 探索性研究 | 确认性研究、CFA 模型拟合 |
Case A 实际上应该用 CFA(因为有先验三维假设),但本课用 EFA 演示—— 研究生学位论文经常先做 EFA"看维度结构",再做 CFA"验证"。
🚀 拆解实战 G:报告(APA)
为检验 AI 学习焦虑量表的结构效度,本研究对 12 个题项进行了
探索性因子分析(EFA)。前提检验显示, KMO = .87, Bartlett's
球形检验 χ²(66) = 1842.34, p < .001, 数据适合做因子分析。
采用主轴因子法提取因子, Varimax 正交旋转。基于特征值 > 1 与
碎石图拐点, 共提取 3 个因子, 累计解释方差 46.5%。
旋转后载荷表显示三因子结构清晰: Factor 1 由 Anxiety_1-4
组成(载荷 .65-.75), 命名为"认知焦虑"; Factor 2 由 Anxiety_5-8
组成(载荷 .69-.74), 命名为"情感焦虑"; Factor 3 由 Anxiety_9-12
组成(载荷 .68-.72), 命名为"行为回避"。无显著交叉载荷(均 < .30)。
(详见表 4)📦 本课交付物(提交给 AI 初审/讲师抽检)
- [ ] KMO 和 Bartlett 检验结果:含具体数值
- [ ] 碎石图(PNG/PDF):标注拐点位置
- [ ] 旋转后因子载荷表:APA 格式三线表
- [ ] EFA 报告段落(约 200 字):含完整流程描述 + 三因子命名
🏁 小结与自测 (Milestone Checklist)
- [ ] 我跑出了 KMO > .60 + Bartlett p < .05 的前提检验通过
- [ ] 我用主轴因子法 + Varimax 旋转提取因子
- [ ] 我综合用了特征值 > 1 + 碎石图 + 理论预期判断因子数
- [ ] 我的载荷表中所有题项都有清晰归属(载荷 > .40 单一因子)
- [ ] 没有显著交叉载荷(差值 > .10),或已处理
- [ ] 我能为每个因子命名(基于其下题项的共同内涵)
- [ ] 我清楚 EFA 是探索(看维度),CFA 是验证(拟合理论模型)
