第 30 课:AI 辅助结果解释与 Results 写作
🎯 核心实操目标
通关要求:让 AI 把 Jamovi/SPSS 跑出的天书表格翻译成符合 APA 7th 格式的学术段落。本课你将掌握**"学术翻译官"Prompt**——AI 只负责语言转换,绝不允许重新计算或编造数字。同时学会识别 AI 解读统计结果的 5 大高危错误。
📋 课前准备(5 分钟自检)
工具/账号
- [ ] Claude 4.7 Opus(学术语言最严谨)或 GPT-5
- [ ] Kimi K2(备用,长上下文塞入大批量统计输出)
数据/素材
- [ ] 完整的统计软件输出(来自第 25-29 课)
- [ ] 标准 APA 格式参考样例(从已发表论文找一篇)
应急通道
- AI 改了你的数字 → 立即打回,强调"不可重新计算"
- AI 给的解读不符合学科规范 → 加入具体期刊样例作为风格锚点
场景痛点破冰:你盯着报表发呆一下午
"学生跑完 Jamovi 输出长达 8 页的统计天书: Estimate / SE / t / p / 95% CI / R² / F / df1 / df2 / VIF / DW...
他盯着报表发呆一下午,最后写到 Results 部分时只写了一句: '所以它们有关系。'
导师看到后直接把稿子扔进了碎纸机。
我们必须让 AI 当一个没有感情的读表翻译机器—— 它的任务不是重新计算,不是给你新数字, 而是把统计软件已经跑出的输出,用顶刊审稿人最熟悉的冷酷术语翻译出来。"
🗺️ 架构重组:学术翻译官的工作边界
| ✅ AI 可以做 | ❌ AI 绝不能做 |
|---|---|
| 把 Jamovi 输出表格转为 APA 文字 | 重新计算 p 值或 β |
| 添加合适的过渡句和结构 | 修改你已跑出的数字 |
| 解读效应量大小(小/中/大) | 凭空补齐你没跑的数字 |
| 标注 H1/H2 是否得到支持 | 推断你没检验的因果关系 |
| 提示哪里需要补稳健性检验 | 把横截面回归解读为因果 |
⚠️ AI 解读统计的 5 大高危错误
- 虚报显著性:把 p = .051 说成 p < .05
- 过度解读不显著结果:"虽然不显著但仍有趋势..."
- 混淆相关与因果:把"预测"换成"导致"
- 效应量误读:β = .15 称为"强影响"
- p 值张冠李戴:把 X1 的 p 值报给 X2
🚀 拆解实战 A:学术翻译官标准 Prompt
【Role】顶级 SSCI 期刊数据审核与论文编辑。
【Safety Constraint - 核心红线】
我会向你提供 Jamovi/SPSS 的统计输出原文。
- 严禁重新计算任何数值!
- 严禁修改我提供的数字!
- 严禁补充我没跑的统计量!
【Task】请把下面我跑出的统计输出, 翻译为论文 Results 部分的
APA 格式学术段落。
【格式要求】
1. 严格 APA 7th 格式: "回归分析表明, A 对 B 具有显著的
负向预测作用(β = -.34, t(498) = -6.21, p < .001,
95% CI [-.45, -.23]), 效应量为中等水平。"
2. 每个假设独立成段, 明确说明:
- 用了什么统计方法
- 关键统计量是什么(t/F/β/R²/p/CI)
- 效应量大小评估(小/中/大)
- H1 / H2 是否得到支持
3. 永远使用"预测"、"关联"、"显著差异",
**绝对禁止**"导致"、"决定"、"引起"等因果动词
4. 如发现我没跑某项关键统计量, 标记"⚠️ 缺失"
而不要替我编造
【Jamovi 输出】[在此粘贴]🚀 拆解实战 B:典型场景示范
场景 1:多元回归输出 → APA
输入(Jamovi 输出原样):
Model: Efficacy_Mean ~ Anxiety_Mean + Strategy_Mean + Gender + Grade
R² = .224, Adjusted R² = .218, F(4, 495) = 35.78, p < .001
Coefficients:
Estimate SE β t p
Intercept 2.512 .128 19.62 <.001
Anxiety_Mean -.187 .039 -.21 -4.79 <.001
Strategy_Mean .421 .046 .38 9.15 <.001
Gender(F) -.054 .062 -.04 -.87 .386
Grade .032 .025 .05 1.28 .200AI 翻译后输出(节选):
为检验 H1, 以自我效能感为因变量, AI 焦虑与学习策略为预测变量,
控制性别与年级, 构建多元线性回归模型。
模型整体显著, F(4, 495) = 35.78, p < .001, R² = .224(Adj. R² = .218),
表明四个预测变量共解释了自我效能感 22.4% 的方差。
控制其他变量后:
- AI 焦虑显著负向预测自我效能感(β = -.21, t(495) = -4.79, p < .001),
效应量小到中等;
- 学习策略显著正向预测自我效能感(β = .38, t(495) = 9.15, p < .001),
效应量中等偏大;
- 控制变量中, 性别(β = -.04, p = .386)和年级(β = .05, p = .200)
均不显著。
H1 得到支持。场景 2:Bootstrap 中介结果 → APA
输入:
Indirect effect (Anxiety → Strategy → Efficacy):
ab = -.143, SE = .025, 95% CI [-.20, -.09]
Direct effect: c' = -.15, p = .002
Total effect: c = -.29, p < .001
Proportion mediated: 49.3%AI 翻译后输出:
为检验 H2, 采用 Bootstrap 中介检验(5000 次重抽样)。
学习策略在 AI 焦虑与自我效能感之间的**间接效应显著**,
ab = -.143, SE = .025, 95% CI [-.20, -.09](置信区间不含 0)。
直接效应 c' = -.15, p = .002 仍然显著, 总效应 c = -.29, p < .001。
间接效应占总效应的 49.3%, 表明**学习策略起部分中介作用**。
H2 得到支持。🚀 拆解实战 C:识别 AI 的 5 大高危错误
错误 1:虚报显著性
AI 错误输出:
"AI 焦虑显著负向预测自我效能感(p = .051)..."
问题:p = .051 严格上不显著(虽然非常接近)。 修正:报告时应该写"边缘显著"(marginally significant)或保持非显著表述。
错误 2:过度解读不显著
AI 错误输出:
"虽然性别效应不显著(p = .386), 但呈现出女生焦虑略高的趋势..."
问题:"趋势"是不存在的——p = .386 等于没差异。 修正:直接说"性别效应不显著",不要扩展。
错误 3:混淆相关与因果
AI 错误输出:
"AI 焦虑导致了自我效能下降..."
修正:改为"AI 焦虑负向预测自我效能"。
错误 4:效应量误读
AI 错误输出:
"β = .15 表明 AI 焦虑对自我效能有强烈影响..."
问题:β = .15 是弱到小效应,不是强。 修正:报告"弱到中等效应量"。
错误 5:p 值张冠李戴
AI 错误输出:把变量 X1 的 p 值报到了 X2 的描述里。
修正:必须逐项核对输出表与翻译段落的数字对应关系。
🚀 拆解实战 D:Results 段落完整模板
完整的 Results 章节应有 4-5 段:
4.1 描述统计 —— 见第 24 课
4.2 信度与相关分析 —— 见第 27 / 26 课
4.3 H1 检验(回归) —— 本课重点 1
4.4 H2 检验(中介) —— 本课重点 2
4.5 H3 检验(调节,可选)
4.6 稳健性检验(可选)每段必含的 5 要素:
- 用了什么统计方法
- 核心数字(β/t/F/p/CI/R²)
- 效应量大小评估
- 是否得到支持的结论
- 自然过渡到下一段
🚀 拆解实战 E:自检 Prompt(写完后必跑)
【Role】严苛的盲审专家。
【任务】请挑剔地核查下方 Results 段落, 找出所有可能的问题:
1. 是否所有显著性都用了正确的符号(p < .001, p < .05 等)?
2. 是否报告了完整的效应量(d / β / η² / R²)?
3. 是否使用了非因果动词("预测"/"关联")?
4. 数字是否前后一致(摘要数字 vs 表格数字 vs 段落数字)?
5. 是否有"虚报显著"或"过度解读不显著"的迹象?
【段落】[粘贴你刚写的 Results 段落]📦 本课交付物(提交给 AI 初审/讲师抽检)
- [ ] Results 章节完整草稿(约 800–1200 字):4-5 段标准结构
- [ ] 统计输出对照表:原 Jamovi 输出 vs AI 翻译后段落的数字一一对照
- [ ] 5 大错误自检报告:明确标注本文有无虚报/过度解读/因果混淆等
- [ ] AI 协作日志:记录至少 1 处"AI 输出错误 → 你打回 → AI 修正"过程
🏁 小结与自测 (Milestone Checklist)
- [ ] 我能用"学术翻译官"Prompt 让 AI 不重新计算只翻译
- [ ] 我清楚 AI 解读统计的 5 大高危错误(虚报/过度/因果/效应/张冠李戴)
- [ ] 我的 Results 段落含 5 要素:方法 + 数字 + 效应量 + 结论 + 过渡
- [ ] 我永远用"预测/关联"而非"导致/决定"
- [ ] 我做了完整自检:所有数字与原始统计输出一致
- [ ] 我能识别 AI 编造的不存在的统计量("补齐"幻觉)
