第 24 课：描述统计与图表

🎯 核心实操目标

通关要求：跑出完整的描述统计（频数/百分比/均值/SD/偏度/峰度）+ 制作 APA 规范的描述统计三线表 + 学术级图表（柱状/直方/箱线/折线）。本课你将用 Case A 数据完成符合 SSCI 投稿水准的描述统计章节。

📋 课前准备（5 分钟自检）

工具/账号

[ ] Jamovi 2.5+ 或 SPSS 29+
[ ] Excel / WPS（图表精修）
[ ] GPT-5 / Claude 4.7（AI 辅助生成描述性文字）

数据/素材

[ ] 第 23 课清洗后的 case_A_cleaned.csv（N≈500）
[ ] 数据字典（明确每个变量类型）

应急通道

Jamovi 直出图不够美 → 把数据复制到 Excel 重绘
三线表 Word 不会做 → 用 Markdown 表格写好再粘进 Word

场景痛点破冰：描述统计不是凑字数

"学生写论文 Results 第一段时，常常写出这样的废话： '本研究的样本特征如下：男性 200 人，女性 216 人，平均年龄 22 岁...'
然后就没了。审稿人看完之后只有一个问题：'然后呢？这告诉我什么？'
描述统计不只是堆数字，更要告诉读者：
你的样本代表性如何？
核心变量在什么水平？（偏高 / 中等 / 偏低）
各变量之间相关度如何？（为后续回归铺垫）
一段优秀的描述统计 = 数字 + 解读 + 引出下一步分析。"

🗺️ 架构重组：描述统计三大产出

产出	内容	报告形式
① 样本特征（Demographics）	N、性别比、年龄、年级分布	文字 + 频数表
② 核心变量描述	均值/SD/偏度/峰度/最小值/最大值	APA 三线表
③ 相关矩阵（为回归铺垫）	变量间 Pearson r + 显著性	APA 相关矩阵表

🚀 拆解实战 A：样本特征报告（文字 + 频数表）

Jamovi 操作

Exploration → Descriptives → 选 Gender / Grade / Major_Cat
在 Statistics 中勾选 Frequency tables
跑出每类的 N 和 %

标准文字写法

本研究有效样本共 500 人(经清洗,详见 3.4 节)。其中,
男性 240 人(48.0%),女性 260 人(52.0%);
年龄范围 18-24 岁,M = 20.5 岁,SD = 1.2 岁;
大一 / 大二 / 大三 / 大四 占比分别为
30.4% / 27.6% / 24.8% / 17.2%;
专业分布:文 / 理 / 工 / 艺体 占比 30.2% / 24.8% / 25.4% / 19.6%。

🚀 拆解实战 B：核心变量描述（APA 三线表）

Jamovi 操作

Exploration → Descriptives → 选 Anxiety_Mean / Strategy_Mean / Efficacy_Mean
Statistics 中勾选：Mean / Std deviation / Minimum / Maximum / Skewness / Kurtosis
跑出三个变量的完整描述

APA 三线表格式

═══════════════════════════════════════════════════════════
 变量              N     M     SD    Min   Max   Skew  Kurt
───────────────────────────────────────────────────────────
 1. AI 焦虑       500  3.21  0.78   1.00  5.00  -.12  -.34
 2. 学习策略      500  3.85  0.65   1.50  5.00  -.45   .12
 3. 自我效能感    500  3.92  0.70   1.00  5.00  -.38  -.21
───────────────────────────────────────────────────────────
 注: 所有变量均为 5 点 Likert 量表(1=非常不同意 ~ 5=非常同意)。
═══════════════════════════════════════════════════════════

💡 偏度/峰度的解读

偏度（Skewness）|值| < 1：分布大致对称（可做参数检验）
峰度（Kurtosis）|值| < 1：尖度合理
超出范围 → 考虑非参数方法或数据变换

🚀 拆解实战 C：相关矩阵（为回归铺垫）

Jamovi 操作

Regression → Correlation Matrix
Variables 拖入 Anxiety_Mean / Strategy_Mean / Efficacy_Mean
勾选 Pearson + Report significance + Flag significant correlations

标准 APA 表

═══════════════════════════════════════════════
 变量          1         2         3
───────────────────────────────────────────────
 1. AI 焦虑    —
 2. 学习策略  -.34**     —
 3. 自我效能  -.30**   .42**       —
───────────────────────────────────────────────
 注: N = 500. **p < .01, *p < .05.
═══════════════════════════════════════════════

🚀 拆解实战 D：学术图表四件套

1. 柱状图（分类变量）

适用：性别 / 年级 / 专业分布

Jamovi → Descriptives → Plots → Bar plot
字号 ≥ 8pt，标注百分比

2. 直方图（连续变量分布）

适用：年龄 / 量表均分

重点观察：是否近似正态分布
异常分布需要在文字中说明并考虑数据变换

3. 箱线图（异常值检测 + 组间对比）

适用：跨性别 / 跨年级的量表均分对比

箱体上下沿 = 四分位数
离群点 = 异常值候选

4. 折线图（趋势 / 时间）

适用：纵向追踪研究（本课不用，第31课介绍）

图表生成 Prompt

markdown

【Role】Seaborn + matplotlib 学术可视化专家。

【任务】我有 Case A 清洗后数据,请生成 Python 代码画 4 张学术图:
1. 性别 + 年级的双柱状对比图
2. 三个量表均分的直方图(2x2 子图,含正态曲线)
3. 三个量表均分按性别分组的箱线图
4. 三个量表均分的相关散点矩阵(下三角散点 + 上三角相关系数)

【美学规范】
- 配色: 学术冷色系(蓝 + 灰 + 偶尔橘色作强调)
- 字体: Times New Roman 11pt
- 分辨率: dpi=300
- 标题: Figure 1/2/3/4. [简洁标题]
- 输出: PDF + PNG 双格式

[贴入数据 CSV 或 DataFrame head]

🚀 拆解实战 E：让 AI 帮你写 Results 第一段

描述统计 → APA 段落 Prompt

markdown

【Role】APA 7th 格式严谨的论文编辑。

【任务】下面是我用 Jamovi 跑出的描述统计输出(粘贴整张表)。
请帮我撰写论文 4.1 节"描述统计"段落(约 250 字):

1. 第一句:报告样本规模与人口结构
2. 第二句:报告三个核心变量的均值水平评估
   (如"焦虑均值 3.21,处于中等水平")
3. 第三句:报告偏度/峰度,说明数据近似正态
4. 第四句:简述相关矩阵的核心发现
   (如"AI 焦虑与自我效能呈中等负相关 r=-.30")
5. 末句:自然过渡到下一节"假设检验"

【严格 APA 格式】
- 数字保留 2 位小数
- 显著性用 ** p<.01, * p<.05
- N 写完整: N = 500, 不要省

【粘贴 Jamovi 输出】[贴入]

📦 本课交付物（提交给 AI 初审/讲师抽检）

[ ] 样本特征段（约 100 字）：N + 性别/年龄/年级/专业分布
[ ] APA 描述统计表：含 M/SD/Min/Max/Skew/Kurt 完整字段
[ ] APA 相关矩阵表：三个核心变量的 Pearson r + 显著性
[ ] 4 张学术图表：柱状 + 直方 + 箱线 + 散点（300 dpi PDF）
[ ] Results 第一段草稿（约 250 字）：用 AI 辅助生成 + 人工修订

🏁 小结与自测 (Milestone Checklist)

[ ] 我能跑出完整描述统计（N/M/SD/Min/Max/Skew/Kurt）
[ ] 我的描述统计表符合 APA 三线表规范
[ ] 我能解读相关矩阵中的强度（弱/中/强）+ 显著性
[ ] 我的图表分辨率 ≥ 300 dpi，字号 ≥ 8pt
[ ] 我能区分柱状/直方/箱线图的不同用途
[ ] 我的 Results 描述段不只是堆数字，含解读 + 自然过渡到下一节
[ ] 偏度/峰度都在 |值| < 1 范围（如不在，考虑数据变换或非参数检验）

第 24 课：描述统计与图表 ​

📋 课前准备（5 分钟自检） ​

工具/账号 ​

数据/素材 ​

应急通道 ​

场景痛点破冰：描述统计不是凑字数 ​

🗺️ 架构重组：描述统计三大产出 ​

🚀 拆解实战 A：样本特征报告（文字 + 频数表） ​

Jamovi 操作 ​

标准文字写法 ​

🚀 拆解实战 B：核心变量描述（APA 三线表） ​

Jamovi 操作 ​

APA 三线表格式 ​

🚀 拆解实战 C：相关矩阵（为回归铺垫） ​

Jamovi 操作 ​

标准 APA 表 ​

相关强度判断 ​

🚀 拆解实战 D：学术图表四件套 ​

1. 柱状图（分类变量） ​

2. 直方图（连续变量分布） ​

3. 箱线图（异常值检测 + 组间对比） ​

4. 折线图（趋势 / 时间） ​

🚀 拆解实战 E：让 AI 帮你写 Results 第一段 ​

📦 本课交付物（提交给 AI 初审/讲师抽检） ​

🏁 小结与自测 (Milestone Checklist) ​

第 24 课：描述统计与图表

📋 课前准备（5 分钟自检）

工具/账号

数据/素材

应急通道

场景痛点破冰：描述统计不是凑字数

🗺️ 架构重组：描述统计三大产出

🚀 拆解实战 A：样本特征报告（文字 + 频数表）

Jamovi 操作

标准文字写法

🚀 拆解实战 B：核心变量描述（APA 三线表）

Jamovi 操作

APA 三线表格式

🚀 拆解实战 C：相关矩阵（为回归铺垫）

Jamovi 操作

标准 APA 表

相关强度判断

🚀 拆解实战 D：学术图表四件套

1. 柱状图（分类变量）

2. 直方图（连续变量分布）

3. 箱线图（异常值检测 + 组间对比）

4. 折线图（趋势 / 时间）

🚀 拆解实战 E：让 AI 帮你写 Results 第一段

📦 本课交付物（提交给 AI 初审/讲师抽检）

🏁 小结与自测 (Milestone Checklist)