Case A:心理学 / 教育心理 / 问卷研究
配套课程:plan v3 模块三全部 + 模块四(论文写作)+ 模块六(投稿)
研究蓝图
- 研究问题:大学生 AI 学习焦虑对学业自我效能感的影响——学习策略的中介作用
- 研究方法:横截面问卷调查
- 研究模型:X (Anxiety) → M (Strategy) → Y (Efficacy),部分中介
- 目标样本:300–500 名在校大学生
- 核心变量:
- 自变量 X:AI 学习焦虑(3 维:认知 / 情感 / 行为回避)
- 中介变量 M:学习策略(元认知 + 深度学习)
- 因变量 Y:学业自我效能感
文件清单
| 文件 | 说明 |
|---|---|
dataset_A_questionnaire_simulated.csv | 模拟样本数据(N=540,清洗后 ~500 有效,达到 SSCI 问卷研究典型规模) |
generate_dataset.py | 数据生成脚本(可重跑) |
data_dictionary.md | 数据字典(变量定义/反向题/衍生变量) |
README.md | 本文件(使用指南) |
快速上手
通识轨(Jamovi 用户)
- 下载
dataset_A_questionnaire_simulated.csv - 打开 Jamovi,菜单 → Open → 选择该 CSV
- 按
data_dictionary.md第七节指引执行数据清洗:- 剔除
Duration_Min < 3的行 - 用 Compute 创建
Anxiety_4_R = 6 - Anxiety_4(同理 Strategy_8、Efficacy_7) - 创建衍生变量
Anxiety_Mean、Strategy_Mean、Efficacy_Mean
- 剔除
- 按 plan v3 第 24–29 课依次跑:描述统计 → 信度 → EFA → 回归 → 中介
技术进阶轨(Python 用户)
python
import pandas as pd
df = pd.read_csv('dataset_A_questionnaire_simulated.csv')
# 1. 清洗
clean = df[df['Duration_Min'] > 3].copy()
clean['Anxiety_4'] = 6 - clean['Anxiety_4']
clean['Strategy_8'] = 6 - clean['Strategy_8']
clean['Efficacy_7'] = 6 - clean['Efficacy_7']
# 2. 衍生变量
anx_cols = [f'Anxiety_{i}' for i in range(1, 13)]
str_cols = [f'Strategy_{i}' for i in range(1, 9)]
eff_cols = [f'Efficacy_{i}' for i in range(1, 8)]
clean['Anxiety_Mean'] = clean[anx_cols].mean(axis=1)
clean['Strategy_Mean'] = clean[str_cols].mean(axis=1)
clean['Efficacy_Mean'] = clean[eff_cols].mean(axis=1)
# 3. 接下来:相关、回归、中介分析(参见第 47 课 Jupyter 模板)预期统计结果(教学锚点)
跑出来如果不在以下范围内,可能是清洗步骤有误:
- Cronbach's α(Anxiety) ≈ 0.83
- Cronbach's α(Strategy) ≈ 0.88
- Cronbach's α(Efficacy) ≈ 0.89
- r(Anxiety_Mean, Strategy_Mean) ≈ −0.30
- r(Strategy_Mean, Efficacy_Mean) ≈ 0.42
- 回归 R² ≈ 0.20
- Bootstrap 中介 95% CI ≈ [−0.22, −0.09],不含 0(部分中介成立)
重新生成数据(如需调整)
bash
cd Course_Materials/Case_A_Psychology
python generate_dataset.py修改 generate_dataset.py 顶部参数可调整:
- 样本量 N
- 各维度的因子载荷
- 中介路径系数 a 与 b
- 反向题位置
- 缺失值比例
与课程的对应
| 课次 | 本数据集的角色 |
|---|---|
| 第 18 课 | 工具安装验证 — 导入数据跑一次描述统计 |
| 第 19–22 课 | 变量映射、问卷设计、数据编码、数据字典 |
| 第 23 课 | 数据清洗(反向题反转 + 无效样本剔除是高频踩坑点) |
| 第 24 课 | 描述统计与图表 |
| 第 25 课 | t 检验、ANOVA(性别 / 年级 / 专业差异) |
| 第 26 课 | 相关分析与多元回归 |
| 第 27 课 | Cronbach's α 信度分析(三量表分别) |
| 第 28 课 | EFA 因子分析(验证 Anxiety 三维结构) |
| 第 29 课 | Bootstrap 中介效应检验 |
| 第 30 课 | AI 辅助 Results 写作(基于本数据的统计输出) |
| 第 31 课 | 案例 A 综合实战,整理为论文中期稿 |
| 模块四 | 基于本数据的完整论文写作 |
| 模块六 | 本论文的同行互评 + Cover Letter + 模拟 Rebuttal |
数据集版本:v3.1 (2026-05) | 维护:年度更新(可能调整效应量或维度结构)
