Case A 数据字典 (Data Dictionary v3.1)
配套数据:
dataset_A_questionnaire_simulated.csv(N=320,~300 有效) 适用课程:模块三第 18–31 课 研究主题:大学生 AI 学习焦虑对学业自我效能感的影响——学习策略的中介作用
一、基本信息
- 样本量:540 行原始数据(含 ~35 个待剔除无效样本 + ~3% 随机缺失)
- 预期有效样本:清洗后约 500(达到 SSCI 问卷研究典型规模)
- 量表数量:3 个(Anxiety / Strategy / Efficacy),共 27 题
- 反向题数量:3 道(必须在清洗时反转记分)
- 量表类型:5 点李克特量表(1=非常不同意 ~ 5=非常同意)
二、人口统计变量
| 变量名 | 标签 | 类型 | 取值与含义 | 缺失值 |
|---|---|---|---|---|
ID | 受访者编号 | 整数 | 1–320 | 无 |
Age | 年龄 | 整数 | 18–24 | 无 |
Gender | 性别 | 名义 | 1=男, 2=女 | 无 |
Grade | 年级 | 序数 | 1=大一, 2=大二, 3=大三, 4=大四 | 无 |
Major_Category | 专业大类 | 名义 | 1=文史哲, 2=理学, 3=工程, 4=艺体/其他 | 无 |
Duration_Min | 答题用时(分钟) | 连续 | 1–22 | 无 |
三、AI 学习焦虑量表(Anxiety_1 ~ Anxiety_12)
三维结构:认知焦虑(4 题)+ 情感焦虑(4 题)+ 行为回避(4 题)
| 变量名 | 维度 | 题项内容(示例) | 反向题 |
|---|---|---|---|
Anxiety_1 | 认知焦虑 | 我担心自己不会使用 AI 工具会影响学业成绩 | |
Anxiety_2 | 认知焦虑 | 看到同学熟练使用 AI 我会感到落后 | |
Anxiety_3 | 认知焦虑 | 我担心 AI 比我更聪明,让我的学习显得无意义 | |
Anxiety_4 | 认知焦虑 | 我相信我能掌控 AI 工具为我服务(5=非常同意 表示 不焦虑) | 🔴 是 |
Anxiety_5 | 情感焦虑 | 想到要学习使用新 AI 工具我会感到紧张 | |
Anxiety_6 | 情感焦虑 | AI 相关的新闻让我感到焦虑 | |
Anxiety_7 | 情感焦虑 | 我对 AI 的快速发展感到不安 | |
Anxiety_8 | 情感焦虑 | 我担心未来 AI 会取代我的就业岗位 | |
Anxiety_9 | 行为回避 | 我会刻意回避了解 AI 的最新进展 | |
Anxiety_10 | 行为回避 | 老师让用 AI 完成作业时我会找借口推脱 | |
Anxiety_11 | 行为回避 | 我尽量不在朋友圈讨论 AI 话题 | |
Anxiety_12 | 行为回避 | 我会避开 AI 相关的选修课 |
关键备注:
- 反向题
Anxiety_4在清洗时必须执行Anxiety_4_R = 6 - Anxiety_4 - 维度归属(用于 EFA 验证):
- 因子 1(认知):Anxiety_1, 2, 3, 4_R
- 因子 2(情感):Anxiety_5, 6, 7, 8
- 因子 3(回避):Anxiety_9, 10, 11, 12
四、学习策略量表(Strategy_1 ~ Strategy_8)
单维结构(含元认知与深度学习策略)
| 变量名 | 题项内容(示例) | 反向题 |
|---|---|---|
Strategy_1 | 我会在学习前制定具体目标 | |
Strategy_2 | 我会主动检查自己是否真的理解了内容 | |
Strategy_3 | 遇到难题我会尝试多种方法 | |
Strategy_4 | 我会把新知识与已有知识联系起来 | |
Strategy_5 | 我能合理安排学习时间 | |
Strategy_6 | 我会反思自己学习过程中的不足 | |
Strategy_7 | 我会主动寻找额外的学习资源 | |
Strategy_8 | 遇到困难我倾向于放弃(5=非常同意 表示 策略差) | 🔴 是 |
关键备注:
- 反向题
Strategy_8在清洗时必须执行Strategy_8_R = 6 - Strategy_8
五、学业自我效能感量表(Efficacy_1 ~ Efficacy_7)
单维结构
| 变量名 | 题项内容(示例) | 反向题 |
|---|---|---|
Efficacy_1 | 我相信自己能完成大部分学业任务 | |
Efficacy_2 | 面对难度大的课程我有信心通过 | |
Efficacy_3 | 即使有挫折我也能坚持完成学业目标 | |
Efficacy_4 | 我相信努力可以克服学习中的困难 | |
Efficacy_5 | 我能在期末考试中取得理想成绩 | |
Efficacy_6 | 我有信心独立完成研究性作业 | |
Efficacy_7 | 我经常怀疑自己的学习能力(5=非常同意 表示 效能感低) | 🔴 是 |
关键备注:
- 反向题
Efficacy_7在清洗时必须执行Efficacy_7_R = 6 - Efficacy_7
六、衍生变量(清洗后计算)
| 变量名 | 计算方式 | 用途 |
|---|---|---|
Anxiety_Mean | 12 题反转后的均值 | 总焦虑得分(中介路径 X) |
Anxiety_Cog_Mean | 题项 1, 2, 3, 4_R 均值 | 认知焦虑维度 |
Anxiety_Emo_Mean | 题项 5, 6, 7, 8 均值 | 情感焦虑维度 |
Anxiety_Avd_Mean | 题项 9, 10, 11, 12 均值 | 行为回避维度 |
Strategy_Mean | 8 题反转后的均值 | 中介变量 M |
Efficacy_Mean | 7 题反转后的均值 | 因变量 Y |
七、数据清洗步骤(必做)
- 剔除无效样本:
Duration_Min < 3或缺失率 > 30% 或规律性应答(如全选同一项) - 处理缺失值:若量表整体缺失 < 5%,使用均值填补;> 20% 整行删除
- 反向题反转:Anxiety_4 / Strategy_8 / Efficacy_7 执行
6 - x - 计算总分/均分:见第六节
八、可在本数据上跑通的统计分析(教学演示)
| 分析方法 | 课次 | 预期结果 |
|---|---|---|
| 描述统计 | 第 24 课 | 三量表均值约 2.8–3.5,标准差 0.65–0.85 |
| 独立样本 t 检验 | 第 25 课 | 性别 / 年级差异部分显著 |
| 单因素 ANOVA | 第 25 课 | 专业大类对 Strategy 有显著影响 |
| 相关分析 | 第 26 课 | r(Anx, Str) ≈ −.30, r(Anx, Eff) ≈ −.26, r(Str, Eff) ≈ .42 |
| 多元回归 | 第 26 课 | β(Anx)=−.21, β(Str)=.38, R² ≈ .20 |
| Cronbach's α | 第 27 课 | Anxiety ≈ .83, Strategy ≈ .88, Efficacy ≈ .89 |
| EFA(Anxiety 12 题) | 第 28 课 | 三因子结构清晰,KMO > .8 |
| Bootstrap 中介 | 第 29 课 | 间接效应 ≈ −.15, 95% CI ≈ [−.22, −.09],不含 0 |
九、伦理与重生成
- 本数据完全模拟,无真实受访者,可自由用于教学
- 数据生成代码见
generate_dataset.py,使用np.random.seed(42)保证可复现 - 如需修改样本量、效应量、维度结构,编辑脚本顶部参数后重跑
版本:v3.1 (2026-05) | 维护:跟随 plan v3.x 同步更新
