第 27 课:统计分析(三)信度与效度检验
🎯 核心实操目标
通关要求:跑出每个量表的 Cronbach's α 信度系数,理解效度(内容/结构/聚敛/区分)四级体系。本课你将用 Case A 跑通三个量表的信度分析,达到 SSCI 标准(α > .70),并掌握 α 过低时的诊断与改善策略。
📋 课前准备(5 分钟自检)
工具/账号
- [ ] Jamovi 2.5+(含 Reliability 模块)
- [ ] 第 23 课清洗后数据,反向题已正确反转
数据/素材
- [ ] Anxiety 12 题 + Strategy 8 题 + Efficacy 7 题
应急通道
- α 大幅低于 .7 → 100% 是反向题没反转,回去重做第 23 课
- 量表只有 3 题 → α 偏低正常,参考 Inter-Item Correlation 替代
场景痛点破冰:α = 0.4 怎么办?
"学生兴冲冲跑出 Cronbach's α,结果:
- AI 焦虑 12 题 → α = 0.41
- 学习策略 8 题 → α = 0.35
这是不可发表的水平(SSCI 要求 α > .70)。 学生慌了,开始删题、删人、换分析方法...
真相:99% 这种情况是反向题没反转! 反向题与正向题"反向"加总,造成内部一致性骤降。 反转后再跑:α 立刻飙到 .85 以上。"
🗺️ 架构重组:信效度双层体系
| 概念 | 含义 | 怎么测 |
|---|---|---|
| 信度(Reliability) | 测量工具的稳定性和一致性 | Cronbach's α / Test-Retest |
| 效度(Validity) | 测量工具是否真正测了想测的东西 | 内容 / 结构 / 聚敛 / 区分 |
效度四级体系
内容效度(Content Validity)
↓ 量表是否覆盖构念的所有方面?(专家评审)
结构效度(Construct Validity)
↓ 量表的内部维度结构是否符合理论?(EFA/CFA)
聚敛效度(Convergent Validity)
↓ 同一构念的不同题项是否彼此相关?(AVE > .5)
区分效度(Discriminant Validity)
↓ 不同构念间是否真的不同?(√AVE > 因子间相关)🚀 拆解实战 A:Cronbach's α 计算
Jamovi 操作
- Factor → Reliability Analysis
- Items:拖入同一量表的所有题(如 Anxiety_1 到 Anxiety_12,反向题用反转后的版本)
- Statistics 勾选:
- Cronbach's α
- Item-Rest correlation(每题与其他题总分的相关)
- Item statistics
- α if item dropped(删某题后 α 值,用于改善)
- 运行
α 判断标准(SSCI 通用)
| α | 评估 | 行动 |
|---|---|---|
| α ≥ .90 | 优秀 | 可能题项冗余,看是否需要简化 |
| .80 ≤ α < .90 | 良好(理想区间) | 可直接报告 |
| .70 ≤ α < .80 | 可接受 | 报告,但讨论可能局限 |
| .60 ≤ α < .70 | 边缘 | 必须改善或更换量表 |
| α < .60 | 不可接受 | 检查反向题是否反转! |
标准报告
本研究三个量表的内部一致性信度均达到良好水平:
AI 焦虑量表(12 题, α = .83),
学习策略量表(8 题, α = .88),
学业自我效能感量表(7 题, α = .89)。
进一步的分维度信度分析显示:
- 认知焦虑(4 题, α = .79)
- 情感焦虑(4 题, α = .81)
- 行为回避(4 题, α = .77)
各分量表信度均高于 .70 可接受标准。🚀 拆解实战 B:α 过低的诊断与改善
步骤 1:检查反向题(99% 案例)
回到第 23 课清洗日志,确认所有反向题都执行了 6 - 原值 反转。
步骤 2:查看 Item-Rest Correlation
- 该指标 < .30 的题项与整体量表关联弱
- 考虑删除或修订
步骤 3:查看 α if item dropped
Jamovi 会列出"删某题后 α 值":
- 如果删某题后 α 反而上升 → 该题质量差,可考虑删除
- 但不要为了凑高 α 删一堆题(删超过 1/4 题目就要重新做 EFA 验证维度结构)
步骤 4:检查量表整体
如果上述都做了 α 仍 < .70:
- 可能你的样本与原量表开发时差异过大
- 考虑用 EFA 重新验证维度结构
- 或者更换更成熟的量表
🚀 拆解实战 C:效度初步检验
内容效度(Expert Judgment)
- 一般在量表设计阶段:3-5 位领域专家逐题评估"是否测了该构念"
- 用 CVI(Content Validity Index)量化:每题 CVI ≥ .78 为可接受
- 论文中只需声明"量表采用 X(Y) 开发的成熟量表,已通过专家内容效度评估"
结构效度(Factor Analysis)
下一课(第28课 EFA)专门讲。
聚敛效度与区分效度(CFA 阶段)
- AVE(Average Variance Extracted)> .5 → 聚敛效度好
- 每个潜变量的 √AVE > 与其他潜变量的相关 → 区分效度好
- 需要在 CFA 阶段计算(本课程不强制,进阶可学)
🚀 拆解实战 D:分维度信度(多维量表的关键)
如果你的量表是多维结构(如 AI 焦虑分认知/情感/回避三维),必须分别报告:
| 报告 | 含义 |
|---|---|
| 全量表 α | 整体内部一致性 |
| 各分量表 α | 每个维度的内部一致性 |
两者都报告才是完整的。
操作
在 Jamovi Reliability Analysis 中分别选择不同维度的题项分批跑:
- 第 1 次:选 Anxiety_1 到 Anxiety_12(全量表)
- 第 2 次:选 Anxiety_1 到 Anxiety_4(认知维度)
- 第 3 次:选 Anxiety_5 到 Anxiety_8(情感维度)
- 第 4 次:选 Anxiety_9 到 Anxiety_12(行为维度)
🚀 拆解实战 E:AI 辅助信度报告
markdown
【Role】APA 严谨的论文编辑。
【任务】下面是我跑出的三个量表 Cronbach's α 输出(粘贴),
请帮我撰写论文 3.3 节"测量工具"末尾的信度报告段落:
1. 全量表 α + 各分量表 α 都要报
2. 标注每个量表的题数
3. 与可接受标准(.70)对比给出评估
4. APA 格式: α = .83 (不写 0.83)
【Jamovi 输出】[粘贴]📦 本课交付物(提交给 AI 初审/讲师抽检)
- [ ] 三个量表的全量表 α:Anxiety / Strategy / Efficacy
- [ ] Anxiety 三个分维度的 α:认知 / 情感 / 行为
- [ ] Item-Rest Correlation 表:每题与整体的关联系数
- [ ] 信度报告段落(约 150 字):含 APA 格式 + 评估解读
🏁 小结与自测 (Milestone Checklist)
- [ ] 我能跑出 Cronbach's α 并解读其评估等级
- [ ] 我的反向题已正确反转,α 在 .70 以上
- [ ] 多维量表我同时报告了全量表 α + 各分维度 α
- [ ] 我能用 "α if item dropped" 诊断哪些题质量低
- [ ] 我清楚 α < .60 时第一反应是检查反向题反转
- [ ] 我清楚信度(一致性)与效度(测得对不对)的差异
- [ ] 我的 APA 格式正确:用
α = .83而非0.83
