Skip to content

第 24 课:描述统计与图表

🎯 核心实操目标

通关要求:跑出完整的描述统计(频数/百分比/均值/SD/偏度/峰度)+ 制作 APA 规范的描述统计三线表 + 学术级图表(柱状/直方/箱线/折线)。本课你将用 Case A 数据完成符合 SSCI 投稿水准的描述统计章节。

📋 课前准备(5 分钟自检)

工具/账号

  • [ ] Jamovi 2.5+ 或 SPSS 29+
  • [ ] Excel / WPS(图表精修)
  • [ ] GPT-5 / Claude 4.7(AI 辅助生成描述性文字)

数据/素材

  • [ ] 第 23 课清洗后的 case_A_cleaned.csv(N≈500)
  • [ ] 数据字典(明确每个变量类型)

应急通道

  • Jamovi 直出图不够美 → 把数据复制到 Excel 重绘
  • 三线表 Word 不会做 → 用 Markdown 表格写好再粘进 Word

场景痛点破冰:描述统计不是凑字数

"学生写论文 Results 第一段时,常常写出这样的废话: '本研究的样本特征如下:男性 200 人,女性 216 人,平均年龄 22 岁...'

然后就没了。 审稿人看完之后只有一个问题:'然后呢?这告诉我什么?'

描述统计不只是堆数字,更要告诉读者:

  • 你的样本代表性如何?
  • 核心变量在什么水平?(偏高 / 中等 / 偏低)
  • 各变量之间相关度如何?(为后续回归铺垫)

一段优秀的描述统计 = 数字 + 解读 + 引出下一步分析。"

🗺️ 架构重组:描述统计三大产出

产出内容报告形式
样本特征(Demographics)N、性别比、年龄、年级分布文字 + 频数表
核心变量描述均值/SD/偏度/峰度/最小值/最大值APA 三线表
相关矩阵(为回归铺垫)变量间 Pearson r + 显著性APA 相关矩阵表

🚀 拆解实战 A:样本特征报告(文字 + 频数表)

Jamovi 操作

  1. Exploration → Descriptives → 选 Gender / Grade / Major_Cat
  2. 在 Statistics 中勾选 Frequency tables
  3. 跑出每类的 N 和 %

标准文字写法

本研究有效样本共 500 人(经清洗,详见 3.4 节)。其中,
男性 240 人(48.0%),女性 260 人(52.0%);
年龄范围 18-24 岁,M = 20.5 岁,SD = 1.2 岁;
大一 / 大二 / 大三 / 大四 占比分别为
30.4% / 27.6% / 24.8% / 17.2%;
专业分布:文 / 理 / 工 / 艺体 占比 30.2% / 24.8% / 25.4% / 19.6%。

🚀 拆解实战 B:核心变量描述(APA 三线表)

Jamovi 操作

  1. Exploration → Descriptives → 选 Anxiety_Mean / Strategy_Mean / Efficacy_Mean
  2. Statistics 中勾选:Mean / Std deviation / Minimum / Maximum / Skewness / Kurtosis
  3. 跑出三个变量的完整描述

APA 三线表格式

═══════════════════════════════════════════════════════════
 变量              N     M     SD    Min   Max   Skew  Kurt
───────────────────────────────────────────────────────────
 1. AI 焦虑       500  3.21  0.78   1.00  5.00  -.12  -.34
 2. 学习策略      500  3.85  0.65   1.50  5.00  -.45   .12
 3. 自我效能感    500  3.92  0.70   1.00  5.00  -.38  -.21
───────────────────────────────────────────────────────────
 注: 所有变量均为 5 点 Likert 量表(1=非常不同意 ~ 5=非常同意)。
═══════════════════════════════════════════════════════════

💡 偏度/峰度的解读

  • 偏度(Skewness)|值| < 1:分布大致对称(可做参数检验)
  • 峰度(Kurtosis)|值| < 1:尖度合理
  • 超出范围 → 考虑非参数方法或数据变换

🚀 拆解实战 C:相关矩阵(为回归铺垫)

Jamovi 操作

  1. Regression → Correlation Matrix
  2. Variables 拖入 Anxiety_Mean / Strategy_Mean / Efficacy_Mean
  3. 勾选 Pearson + Report significance + Flag significant correlations

标准 APA 表

═══════════════════════════════════════════════
 变量          1         2         3
───────────────────────────────────────────────
 1. AI 焦虑    —
 2. 学习策略  -.34**     —
 3. 自我效能  -.30**   .42**       —
───────────────────────────────────────────────
 注: N = 500. **p < .01, *p < .05.
═══════════════════════════════════════════════

相关强度判断

| |r| | 强度 | |---|---| | < .10 | 极弱 / 无 | | .10 – .30 | 弱 | | .30 – .70 | 中等(社科最常见) | | .70 – .90 | 强(小心多重共线性) | | > .90 | 几乎是同一变量 |

🚀 拆解实战 D:学术图表四件套

1. 柱状图(分类变量)

适用:性别 / 年级 / 专业分布

  • Jamovi → Descriptives → Plots → Bar plot
  • 字号 ≥ 8pt,标注百分比

2. 直方图(连续变量分布)

适用:年龄 / 量表均分

  • 重点观察:是否近似正态分布
  • 异常分布需要在文字中说明并考虑数据变换

3. 箱线图(异常值检测 + 组间对比)

适用:跨性别 / 跨年级的量表均分对比

  • 箱体上下沿 = 四分位数
  • 离群点 = 异常值候选

4. 折线图(趋势 / 时间)

适用:纵向追踪研究(本课不用,第31课介绍)

markdown
【Role】Seaborn + matplotlib 学术可视化专家。

【任务】我有 Case A 清洗后数据,请生成 Python 代码画 4 张学术图:
1. 性别 + 年级的双柱状对比图
2. 三个量表均分的直方图(2x2 子图,含正态曲线)
3. 三个量表均分按性别分组的箱线图
4. 三个量表均分的相关散点矩阵(下三角散点 + 上三角相关系数)

【美学规范】
- 配色: 学术冷色系(蓝 + 灰 + 偶尔橘色作强调)
- 字体: Times New Roman 11pt
- 分辨率: dpi=300
- 标题: Figure 1/2/3/4. [简洁标题]
- 输出: PDF + PNG 双格式

[贴入数据 CSV 或 DataFrame head]

🚀 拆解实战 E:让 AI 帮你写 Results 第一段

markdown
【Role】APA 7th 格式严谨的论文编辑。

【任务】下面是我用 Jamovi 跑出的描述统计输出(粘贴整张表)。
请帮我撰写论文 4.1 节"描述统计"段落(约 250 字):

1. 第一句:报告样本规模与人口结构
2. 第二句:报告三个核心变量的均值水平评估
   (如"焦虑均值 3.21,处于中等水平")
3. 第三句:报告偏度/峰度,说明数据近似正态
4. 第四句:简述相关矩阵的核心发现
   (如"AI 焦虑与自我效能呈中等负相关 r=-.30")
5. 末句:自然过渡到下一节"假设检验"

【严格 APA 格式】
- 数字保留 2 位小数
- 显著性用 ** p<.01, * p<.05
- N 写完整: N = 500, 不要省

【粘贴 Jamovi 输出】[贴入]

📦 本课交付物(提交给 AI 初审/讲师抽检)

  • [ ] 样本特征段(约 100 字):N + 性别/年龄/年级/专业分布
  • [ ] APA 描述统计表:含 M/SD/Min/Max/Skew/Kurt 完整字段
  • [ ] APA 相关矩阵表:三个核心变量的 Pearson r + 显著性
  • [ ] 4 张学术图表:柱状 + 直方 + 箱线 + 散点(300 dpi PDF)
  • [ ] Results 第一段草稿(约 250 字):用 AI 辅助生成 + 人工修订

🏁 小结与自测 (Milestone Checklist)

  • [ ] 我能跑出完整描述统计(N/M/SD/Min/Max/Skew/Kurt)
  • [ ] 我的描述统计表符合 APA 三线表规范
  • [ ] 我能解读相关矩阵中的强度(弱/中/强)+ 显著性
  • [ ] 我的图表分辨率 ≥ 300 dpi,字号 ≥ 8pt
  • [ ] 我能区分柱状/直方/箱线图的不同用途
  • [ ] 我的 Results 描述段不只是堆数字,含解读 + 自然过渡到下一节
  • [ ] 偏度/峰度都在 |值| < 1 范围(如不在,考虑数据变换或非参数检验)

助力学者在 AI 时代极速产出高质量学术成果 · 55 课时双轨制 · plan v3.3