第 30 课：AI 辅助结果解释与 Results 写作

🎯 核心实操目标

通关要求：让 AI 把 Jamovi/SPSS 跑出的天书表格翻译成符合 APA 7th 格式的学术段落。本课你将掌握**"学术翻译官"Prompt**——AI 只负责语言转换，绝不允许重新计算或编造数字。同时学会识别 AI 解读统计结果的 5 大高危错误。

📋 课前准备（5 分钟自检）

工具/账号

[ ] Claude 4.7 Opus（学术语言最严谨）或 GPT-5
[ ] Kimi K2（备用，长上下文塞入大批量统计输出）

数据/素材

[ ] 完整的统计软件输出（来自第 25-29 课）
[ ] 标准 APA 格式参考样例（从已发表论文找一篇）

应急通道

AI 改了你的数字 → 立即打回，强调"不可重新计算"
AI 给的解读不符合学科规范 → 加入具体期刊样例作为风格锚点

场景痛点破冰：你盯着报表发呆一下午

"学生跑完 Jamovi 输出长达 8 页的统计天书： Estimate / SE / t / p / 95% CI / R² / F / df1 / df2 / VIF / DW...
他盯着报表发呆一下午，最后写到 Results 部分时只写了一句： '所以它们有关系。'
导师看到后直接把稿子扔进了碎纸机。
我们必须让 AI 当一个没有感情的读表翻译机器—— 它的任务不是重新计算，不是给你新数字，而是把统计软件已经跑出的输出，用顶刊审稿人最熟悉的冷酷术语翻译出来。"

🗺️ 架构重组：学术翻译官的工作边界

✅ AI 可以做	❌ AI 绝不能做
把 Jamovi 输出表格转为 APA 文字	重新计算 p 值或 β
添加合适的过渡句和结构	修改你已跑出的数字
解读效应量大小（小/中/大）	凭空补齐你没跑的数字
标注 H1/H2 是否得到支持	推断你没检验的因果关系
提示哪里需要补稳健性检验	把横截面回归解读为因果

⚠️ AI 解读统计的 5 大高危错误

虚报显著性：把 p = .051 说成 p < .05
过度解读不显著结果："虽然不显著但仍有趋势..."
混淆相关与因果：把"预测"换成"导致"
效应量误读：β = .15 称为"强影响"
p 值张冠李戴：把 X1 的 p 值报给 X2

🚀 拆解实战 A：学术翻译官标准 Prompt

Jamovi → APA 翻译官 Prompt (一键复制)

markdown

【Role】顶级 SSCI 期刊数据审核与论文编辑。

【Safety Constraint - 核心红线】
我会向你提供 Jamovi/SPSS 的统计输出原文。
- 严禁重新计算任何数值!
- 严禁修改我提供的数字!
- 严禁补充我没跑的统计量!

【Task】请把下面我跑出的统计输出, 翻译为论文 Results 部分的
APA 格式学术段落。

【格式要求】
1. 严格 APA 7th 格式: "回归分析表明, A 对 B 具有显著的
   负向预测作用(β = -.34, t(498) = -6.21, p < .001,
   95% CI [-.45, -.23]), 效应量为中等水平。"

2. 每个假设独立成段, 明确说明:
   - 用了什么统计方法
   - 关键统计量是什么(t/F/β/R²/p/CI)
   - 效应量大小评估(小/中/大)
   - H1 / H2 是否得到支持

3. 永远使用"预测"、"关联"、"显著差异",
   **绝对禁止**"导致"、"决定"、"引起"等因果动词

4. 如发现我没跑某项关键统计量, 标记"⚠️ 缺失"
   而不要替我编造

【Jamovi 输出】[在此粘贴]

🚀 拆解实战 B：典型场景示范

场景 1：多元回归输出 → APA

输入（Jamovi 输出原样）：

Model: Efficacy_Mean ~ Anxiety_Mean + Strategy_Mean + Gender + Grade
R² = .224, Adjusted R² = .218, F(4, 495) = 35.78, p < .001

Coefficients:
                Estimate   SE     β     t      p
Intercept        2.512    .128         19.62  <.001
Anxiety_Mean    -.187     .039   -.21  -4.79  <.001
Strategy_Mean    .421     .046    .38   9.15  <.001
Gender(F)       -.054     .062   -.04   -.87   .386
Grade            .032     .025    .05   1.28   .200

AI 翻译后输出（节选）：

为检验 H1, 以自我效能感为因变量, AI 焦虑与学习策略为预测变量,
控制性别与年级, 构建多元线性回归模型。

模型整体显著, F(4, 495) = 35.78, p < .001, R² = .224(Adj. R² = .218),
表明四个预测变量共解释了自我效能感 22.4% 的方差。

控制其他变量后:
- AI 焦虑显著负向预测自我效能感(β = -.21, t(495) = -4.79, p < .001),
  效应量小到中等;
- 学习策略显著正向预测自我效能感(β = .38, t(495) = 9.15, p < .001),
  效应量中等偏大;
- 控制变量中, 性别(β = -.04, p = .386)和年级(β = .05, p = .200)
  均不显著。

H1 得到支持。

场景 2：Bootstrap 中介结果 → APA

输入：

Indirect effect (Anxiety → Strategy → Efficacy):
ab = -.143, SE = .025, 95% CI [-.20, -.09]
Direct effect: c' = -.15, p = .002
Total effect: c = -.29, p < .001
Proportion mediated: 49.3%

AI 翻译后输出：

为检验 H2, 采用 Bootstrap 中介检验(5000 次重抽样)。
学习策略在 AI 焦虑与自我效能感之间的**间接效应显著**,
ab = -.143, SE = .025, 95% CI [-.20, -.09](置信区间不含 0)。
直接效应 c' = -.15, p = .002 仍然显著, 总效应 c = -.29, p < .001。
间接效应占总效应的 49.3%, 表明**学习策略起部分中介作用**。
H2 得到支持。

🚀 拆解实战 C：识别 AI 的 5 大高危错误

错误 1：虚报显著性

AI 错误输出：

"AI 焦虑显著负向预测自我效能感(p = .051)..."

问题：p = .051 严格上不显著（虽然非常接近）。修正：报告时应该写"边缘显著"（marginally significant）或保持非显著表述。

错误 2：过度解读不显著

AI 错误输出：

"虽然性别效应不显著(p = .386), 但呈现出女生焦虑略高的趋势..."

问题："趋势"是不存在的——p = .386 等于没差异。修正：直接说"性别效应不显著"，不要扩展。

错误 3：混淆相关与因果

AI 错误输出：

"AI 焦虑导致了自我效能下降..."

修正：改为"AI 焦虑负向预测自我效能"。

错误 4：效应量误读

AI 错误输出：

"β = .15 表明 AI 焦虑对自我效能有强烈影响..."

问题：β = .15 是弱到小效应，不是强。修正：报告"弱到中等效应量"。

错误 5：p 值张冠李戴

AI 错误输出：把变量 X1 的 p 值报到了 X2 的描述里。

修正：必须逐项核对输出表与翻译段落的数字对应关系。

🚀 拆解实战 D：Results 段落完整模板

完整的 Results 章节应有 4-5 段：

4.1 描述统计       —— 见第 24 课
4.2 信度与相关分析  —— 见第 27 / 26 课
4.3 H1 检验(回归)  —— 本课重点 1
4.4 H2 检验(中介)  —— 本课重点 2
4.5 H3 检验(调节,可选)
4.6 稳健性检验(可选)

每段必含的 5 要素：

用了什么统计方法
核心数字（β/t/F/p/CI/R²）
效应量大小评估
是否得到支持的结论
自然过渡到下一段

🚀 拆解实战 E：自检 Prompt（写完后必跑）

Results 段落自检 Prompt

markdown

【Role】严苛的盲审专家。

【任务】请挑剔地核查下方 Results 段落, 找出所有可能的问题:

1. 是否所有显著性都用了正确的符号(p < .001, p < .05 等)?
2. 是否报告了完整的效应量(d / β / η² / R²)?
3. 是否使用了非因果动词("预测"/"关联")?
4. 数字是否前后一致(摘要数字 vs 表格数字 vs 段落数字)?
5. 是否有"虚报显著"或"过度解读不显著"的迹象?

【段落】[粘贴你刚写的 Results 段落]

📦 本课交付物（提交给 AI 初审/讲师抽检）

[ ] Results 章节完整草稿（约 800–1200 字）：4-5 段标准结构
[ ] 统计输出对照表：原 Jamovi 输出 vs AI 翻译后段落的数字一一对照
[ ] 5 大错误自检报告：明确标注本文有无虚报/过度解读/因果混淆等
[ ] AI 协作日志：记录至少 1 处"AI 输出错误 → 你打回 → AI 修正"过程

🏁 小结与自测 (Milestone Checklist)

[ ] 我能用"学术翻译官"Prompt 让 AI 不重新计算只翻译
[ ] 我清楚 AI 解读统计的 5 大高危错误（虚报/过度/因果/效应/张冠李戴）
[ ] 我的 Results 段落含 5 要素：方法 + 数字 + 效应量 + 结论 + 过渡
[ ] 我永远用"预测/关联"而非"导致/决定"
[ ] 我做了完整自检：所有数字与原始统计输出一致
[ ] 我能识别 AI 编造的不存在的统计量（"补齐"幻觉）

第 30 课：AI 辅助结果解释与 Results 写作 ​

📋 课前准备（5 分钟自检） ​

工具/账号 ​

数据/素材 ​

应急通道 ​

场景痛点破冰：你盯着报表发呆一下午 ​

🗺️ 架构重组：学术翻译官的工作边界 ​

🚀 拆解实战 A：学术翻译官标准 Prompt ​

🚀 拆解实战 B：典型场景示范 ​

场景 1：多元回归输出 → APA ​

场景 2：Bootstrap 中介结果 → APA ​

🚀 拆解实战 C：识别 AI 的 5 大高危错误 ​

错误 1：虚报显著性 ​

错误 2：过度解读不显著 ​

错误 3：混淆相关与因果 ​

错误 4：效应量误读 ​

错误 5：p 值张冠李戴 ​

🚀 拆解实战 D：Results 段落完整模板 ​

🚀 拆解实战 E：自检 Prompt（写完后必跑） ​

📦 本课交付物（提交给 AI 初审/讲师抽检） ​

🏁 小结与自测 (Milestone Checklist) ​

第 30 课：AI 辅助结果解释与 Results 写作

📋 课前准备（5 分钟自检）

工具/账号

数据/素材

应急通道

场景痛点破冰：你盯着报表发呆一下午

🗺️ 架构重组：学术翻译官的工作边界

🚀 拆解实战 A：学术翻译官标准 Prompt

🚀 拆解实战 B：典型场景示范

场景 1：多元回归输出 → APA

场景 2：Bootstrap 中介结果 → APA

🚀 拆解实战 C：识别 AI 的 5 大高危错误

错误 1：虚报显著性

错误 2：过度解读不显著

错误 3：混淆相关与因果

错误 4：效应量误读

错误 5：p 值张冠李戴

🚀 拆解实战 D：Results 段落完整模板

🚀 拆解实战 E：自检 Prompt（写完后必跑）

📦 本课交付物（提交给 AI 初审/讲师抽检）

🏁 小结与自测 (Milestone Checklist)