Case A 数据字典 (Data Dictionary v3.1)

配套数据：dataset_A_questionnaire_simulated.csv（N=320，~300 有效）适用课程：模块三第 18–31 课研究主题：大学生 AI 学习焦虑对学业自我效能感的影响——学习策略的中介作用

一、基本信息

样本量：540 行原始数据（含 ~35 个待剔除无效样本 + ~3% 随机缺失）
预期有效样本：清洗后约 500（达到 SSCI 问卷研究典型规模）
量表数量：3 个（Anxiety / Strategy / Efficacy），共 27 题
反向题数量：3 道（必须在清洗时反转记分）
量表类型：5 点李克特量表（1=非常不同意 ~ 5=非常同意）

二、人口统计变量

变量名	标签	类型	取值与含义	缺失值
`ID`	受访者编号	整数	1–320	无
`Age`	年龄	整数	18–24	无
`Gender`	性别	名义	1=男, 2=女	无
`Grade`	年级	序数	1=大一, 2=大二, 3=大三, 4=大四	无
`Major_Category`	专业大类	名义	1=文史哲, 2=理学, 3=工程, 4=艺体/其他	无
`Duration_Min`	答题用时（分钟）	连续	1–22	无

三、AI 学习焦虑量表（Anxiety_1 ~ Anxiety_12）

三维结构：认知焦虑（4 题）+ 情感焦虑（4 题）+ 行为回避（4 题）

变量名	维度	题项内容（示例）	反向题
`Anxiety_1`	认知焦虑	我担心自己不会使用 AI 工具会影响学业成绩
`Anxiety_2`	认知焦虑	看到同学熟练使用 AI 我会感到落后
`Anxiety_3`	认知焦虑	我担心 AI 比我更聪明，让我的学习显得无意义
`Anxiety_4`	认知焦虑	我相信我能掌控 AI 工具为我服务（5=非常同意表示不焦虑）	🔴 是
`Anxiety_5`	情感焦虑	想到要学习使用新 AI 工具我会感到紧张
`Anxiety_6`	情感焦虑	AI 相关的新闻让我感到焦虑
`Anxiety_7`	情感焦虑	我对 AI 的快速发展感到不安
`Anxiety_8`	情感焦虑	我担心未来 AI 会取代我的就业岗位
`Anxiety_9`	行为回避	我会刻意回避了解 AI 的最新进展
`Anxiety_10`	行为回避	老师让用 AI 完成作业时我会找借口推脱
`Anxiety_11`	行为回避	我尽量不在朋友圈讨论 AI 话题
`Anxiety_12`	行为回避	我会避开 AI 相关的选修课

关键备注：

反向题 Anxiety_4 在清洗时必须执行 Anxiety_4_R = 6 - Anxiety_4
维度归属（用于 EFA 验证）：
- 因子 1（认知）：Anxiety_1, 2, 3, 4_R
- 因子 2（情感）：Anxiety_5, 6, 7, 8
- 因子 3（回避）：Anxiety_9, 10, 11, 12

四、学习策略量表（Strategy_1 ~ Strategy_8）

单维结构（含元认知与深度学习策略）

变量名	题项内容（示例）	反向题
`Strategy_1`	我会在学习前制定具体目标
`Strategy_2`	我会主动检查自己是否真的理解了内容
`Strategy_3`	遇到难题我会尝试多种方法
`Strategy_4`	我会把新知识与已有知识联系起来
`Strategy_5`	我能合理安排学习时间
`Strategy_6`	我会反思自己学习过程中的不足
`Strategy_7`	我会主动寻找额外的学习资源
`Strategy_8`	遇到困难我倾向于放弃（5=非常同意表示策略差）	🔴 是

关键备注：

反向题 Strategy_8 在清洗时必须执行 Strategy_8_R = 6 - Strategy_8

五、学业自我效能感量表（Efficacy_1 ~ Efficacy_7）

单维结构

变量名	题项内容（示例）	反向题
`Efficacy_1`	我相信自己能完成大部分学业任务
`Efficacy_2`	面对难度大的课程我有信心通过
`Efficacy_3`	即使有挫折我也能坚持完成学业目标
`Efficacy_4`	我相信努力可以克服学习中的困难
`Efficacy_5`	我能在期末考试中取得理想成绩
`Efficacy_6`	我有信心独立完成研究性作业
`Efficacy_7`	我经常怀疑自己的学习能力（5=非常同意表示效能感低）	🔴 是

关键备注：

反向题 Efficacy_7 在清洗时必须执行 Efficacy_7_R = 6 - Efficacy_7

六、衍生变量（清洗后计算）

变量名	计算方式	用途
`Anxiety_Mean`	12 题反转后的均值	总焦虑得分（中介路径 X）
`Anxiety_Cog_Mean`	题项 1, 2, 3, 4_R 均值	认知焦虑维度
`Anxiety_Emo_Mean`	题项 5, 6, 7, 8 均值	情感焦虑维度
`Anxiety_Avd_Mean`	题项 9, 10, 11, 12 均值	行为回避维度
`Strategy_Mean`	8 题反转后的均值	中介变量 M
`Efficacy_Mean`	7 题反转后的均值	因变量 Y

七、数据清洗步骤（必做）

剔除无效样本：Duration_Min < 3 或缺失率 > 30% 或规律性应答（如全选同一项）
处理缺失值：若量表整体缺失 < 5%，使用均值填补；> 20% 整行删除
反向题反转：Anxiety_4 / Strategy_8 / Efficacy_7 执行 6 - x
计算总分/均分：见第六节

八、可在本数据上跑通的统计分析（教学演示）

分析方法	课次	预期结果
描述统计	第 24 课	三量表均值约 2.8–3.5，标准差 0.65–0.85
独立样本 t 检验	第 25 课	性别 / 年级差异部分显著
单因素 ANOVA	第 25 课	专业大类对 Strategy 有显著影响
相关分析	第 26 课	r(Anx, Str) ≈ −.30, r(Anx, Eff) ≈ −.26, r(Str, Eff) ≈ .42
多元回归	第 26 课	β(Anx)=−.21, β(Str)=.38, R² ≈ .20
Cronbach's α	第 27 课	Anxiety ≈ .83, Strategy ≈ .88, Efficacy ≈ .89
EFA（Anxiety 12 题）	第 28 课	三因子结构清晰，KMO > .8
Bootstrap 中介	第 29 课	间接效应 ≈ −.15, 95% CI ≈ [−.22, −.09]，不含 0

九、伦理与重生成

本数据完全模拟，无真实受访者，可自由用于教学
数据生成代码见 generate_dataset.py，使用 np.random.seed(42) 保证可复现
如需修改样本量、效应量、维度结构，编辑脚本顶部参数后重跑

版本：v3.1 (2026-05) | 维护：跟随 plan v3.x 同步更新

Case A 数据字典 (Data Dictionary v3.1) ​

一、基本信息 ​

二、人口统计变量 ​

三、AI 学习焦虑量表（Anxiety_1 ~ Anxiety_12） ​

四、学习策略量表（Strategy_1 ~ Strategy_8） ​

五、学业自我效能感量表（Efficacy_1 ~ Efficacy_7） ​

六、衍生变量（清洗后计算） ​

七、数据清洗步骤（必做） ​

八、可在本数据上跑通的统计分析（教学演示） ​

九、伦理与重生成 ​

Case A 数据字典 (Data Dictionary v3.1)

一、基本信息

二、人口统计变量

三、AI 学习焦虑量表（Anxiety_1 ~ Anxiety_12）

四、学习策略量表（Strategy_1 ~ Strategy_8）

五、学业自我效能感量表（Efficacy_1 ~ Efficacy_7）

六、衍生变量（清洗后计算）

七、数据清洗步骤（必做）

八、可在本数据上跑通的统计分析（教学演示）

九、伦理与重生成