第 24 课:描述统计与图表
🎯 核心实操目标
通关要求:跑出完整的描述统计(频数/百分比/均值/SD/偏度/峰度)+ 制作 APA 规范的描述统计三线表 + 学术级图表(柱状/直方/箱线/折线)。本课你将用 Case A 数据完成符合 SSCI 投稿水准的描述统计章节。
📋 课前准备(5 分钟自检)
工具/账号
- [ ] Jamovi 2.5+ 或 SPSS 29+
- [ ] Excel / WPS(图表精修)
- [ ] GPT-5 / Claude 4.7(AI 辅助生成描述性文字)
数据/素材
- [ ] 第 23 课清洗后的
case_A_cleaned.csv(N≈500) - [ ] 数据字典(明确每个变量类型)
应急通道
- Jamovi 直出图不够美 → 把数据复制到 Excel 重绘
- 三线表 Word 不会做 → 用 Markdown 表格写好再粘进 Word
场景痛点破冰:描述统计不是凑字数
"学生写论文 Results 第一段时,常常写出这样的废话: '本研究的样本特征如下:男性 200 人,女性 216 人,平均年龄 22 岁...'
然后就没了。 审稿人看完之后只有一个问题:'然后呢?这告诉我什么?'
描述统计不只是堆数字,更要告诉读者:
- 你的样本代表性如何?
- 核心变量在什么水平?(偏高 / 中等 / 偏低)
- 各变量之间相关度如何?(为后续回归铺垫)
一段优秀的描述统计 = 数字 + 解读 + 引出下一步分析。"
🗺️ 架构重组:描述统计三大产出
| 产出 | 内容 | 报告形式 |
|---|---|---|
| ① 样本特征(Demographics) | N、性别比、年龄、年级分布 | 文字 + 频数表 |
| ② 核心变量描述 | 均值/SD/偏度/峰度/最小值/最大值 | APA 三线表 |
| ③ 相关矩阵(为回归铺垫) | 变量间 Pearson r + 显著性 | APA 相关矩阵表 |
🚀 拆解实战 A:样本特征报告(文字 + 频数表)
Jamovi 操作
- Exploration → Descriptives → 选 Gender / Grade / Major_Cat
- 在 Statistics 中勾选 Frequency tables
- 跑出每类的 N 和 %
标准文字写法
本研究有效样本共 500 人(经清洗,详见 3.4 节)。其中,
男性 240 人(48.0%),女性 260 人(52.0%);
年龄范围 18-24 岁,M = 20.5 岁,SD = 1.2 岁;
大一 / 大二 / 大三 / 大四 占比分别为
30.4% / 27.6% / 24.8% / 17.2%;
专业分布:文 / 理 / 工 / 艺体 占比 30.2% / 24.8% / 25.4% / 19.6%。🚀 拆解实战 B:核心变量描述(APA 三线表)
Jamovi 操作
- Exploration → Descriptives → 选 Anxiety_Mean / Strategy_Mean / Efficacy_Mean
- Statistics 中勾选:Mean / Std deviation / Minimum / Maximum / Skewness / Kurtosis
- 跑出三个变量的完整描述
APA 三线表格式
═══════════════════════════════════════════════════════════
变量 N M SD Min Max Skew Kurt
───────────────────────────────────────────────────────────
1. AI 焦虑 500 3.21 0.78 1.00 5.00 -.12 -.34
2. 学习策略 500 3.85 0.65 1.50 5.00 -.45 .12
3. 自我效能感 500 3.92 0.70 1.00 5.00 -.38 -.21
───────────────────────────────────────────────────────────
注: 所有变量均为 5 点 Likert 量表(1=非常不同意 ~ 5=非常同意)。
═══════════════════════════════════════════════════════════💡 偏度/峰度的解读
- 偏度(Skewness)|值| < 1:分布大致对称(可做参数检验)
- 峰度(Kurtosis)|值| < 1:尖度合理
- 超出范围 → 考虑非参数方法或数据变换
🚀 拆解实战 C:相关矩阵(为回归铺垫)
Jamovi 操作
- Regression → Correlation Matrix
- Variables 拖入 Anxiety_Mean / Strategy_Mean / Efficacy_Mean
- 勾选 Pearson + Report significance + Flag significant correlations
标准 APA 表
═══════════════════════════════════════════════
变量 1 2 3
───────────────────────────────────────────────
1. AI 焦虑 —
2. 学习策略 -.34** —
3. 自我效能 -.30** .42** —
───────────────────────────────────────────────
注: N = 500. **p < .01, *p < .05.
═══════════════════════════════════════════════相关强度判断
| |r| | 强度 | |---|---| | < .10 | 极弱 / 无 | | .10 – .30 | 弱 | | .30 – .70 | 中等(社科最常见) | | .70 – .90 | 强(小心多重共线性) | | > .90 | 几乎是同一变量 |
🚀 拆解实战 D:学术图表四件套
1. 柱状图(分类变量)
适用:性别 / 年级 / 专业分布
- Jamovi → Descriptives → Plots → Bar plot
- 字号 ≥ 8pt,标注百分比
2. 直方图(连续变量分布)
适用:年龄 / 量表均分
- 重点观察:是否近似正态分布
- 异常分布需要在文字中说明并考虑数据变换
3. 箱线图(异常值检测 + 组间对比)
适用:跨性别 / 跨年级的量表均分对比
- 箱体上下沿 = 四分位数
- 离群点 = 异常值候选
4. 折线图(趋势 / 时间)
适用:纵向追踪研究(本课不用,第31课介绍)
markdown
【Role】Seaborn + matplotlib 学术可视化专家。
【任务】我有 Case A 清洗后数据,请生成 Python 代码画 4 张学术图:
1. 性别 + 年级的双柱状对比图
2. 三个量表均分的直方图(2x2 子图,含正态曲线)
3. 三个量表均分按性别分组的箱线图
4. 三个量表均分的相关散点矩阵(下三角散点 + 上三角相关系数)
【美学规范】
- 配色: 学术冷色系(蓝 + 灰 + 偶尔橘色作强调)
- 字体: Times New Roman 11pt
- 分辨率: dpi=300
- 标题: Figure 1/2/3/4. [简洁标题]
- 输出: PDF + PNG 双格式
[贴入数据 CSV 或 DataFrame head]🚀 拆解实战 E:让 AI 帮你写 Results 第一段
markdown
【Role】APA 7th 格式严谨的论文编辑。
【任务】下面是我用 Jamovi 跑出的描述统计输出(粘贴整张表)。
请帮我撰写论文 4.1 节"描述统计"段落(约 250 字):
1. 第一句:报告样本规模与人口结构
2. 第二句:报告三个核心变量的均值水平评估
(如"焦虑均值 3.21,处于中等水平")
3. 第三句:报告偏度/峰度,说明数据近似正态
4. 第四句:简述相关矩阵的核心发现
(如"AI 焦虑与自我效能呈中等负相关 r=-.30")
5. 末句:自然过渡到下一节"假设检验"
【严格 APA 格式】
- 数字保留 2 位小数
- 显著性用 ** p<.01, * p<.05
- N 写完整: N = 500, 不要省
【粘贴 Jamovi 输出】[贴入]📦 本课交付物(提交给 AI 初审/讲师抽检)
- [ ] 样本特征段(约 100 字):N + 性别/年龄/年级/专业分布
- [ ] APA 描述统计表:含 M/SD/Min/Max/Skew/Kurt 完整字段
- [ ] APA 相关矩阵表:三个核心变量的 Pearson r + 显著性
- [ ] 4 张学术图表:柱状 + 直方 + 箱线 + 散点(300 dpi PDF)
- [ ] Results 第一段草稿(约 250 字):用 AI 辅助生成 + 人工修订
🏁 小结与自测 (Milestone Checklist)
- [ ] 我能跑出完整描述统计(N/M/SD/Min/Max/Skew/Kurt)
- [ ] 我的描述统计表符合 APA 三线表规范
- [ ] 我能解读相关矩阵中的强度(弱/中/强)+ 显著性
- [ ] 我的图表分辨率 ≥ 300 dpi,字号 ≥ 8pt
- [ ] 我能区分柱状/直方/箱线图的不同用途
- [ ] 我的 Results 描述段不只是堆数字,含解读 + 自然过渡到下一节
- [ ] 偏度/峰度都在 |值| < 1 范围(如不在,考虑数据变换或非参数检验)
