Skip to content

Case A 数据字典 (Data Dictionary v3.1)

配套数据:dataset_A_questionnaire_simulated.csv(N=320,~300 有效) 适用课程:模块三第 18–31 课 研究主题:大学生 AI 学习焦虑对学业自我效能感的影响——学习策略的中介作用


一、基本信息

  • 样本量:540 行原始数据(含 ~35 个待剔除无效样本 + ~3% 随机缺失)
  • 预期有效样本:清洗后约 500(达到 SSCI 问卷研究典型规模)
  • 量表数量:3 个(Anxiety / Strategy / Efficacy),共 27 题
  • 反向题数量:3 道(必须在清洗时反转记分)
  • 量表类型:5 点李克特量表(1=非常不同意 ~ 5=非常同意)

二、人口统计变量

变量名标签类型取值与含义缺失值
ID受访者编号整数1–320
Age年龄整数18–24
Gender性别名义1=男, 2=女
Grade年级序数1=大一, 2=大二, 3=大三, 4=大四
Major_Category专业大类名义1=文史哲, 2=理学, 3=工程, 4=艺体/其他
Duration_Min答题用时(分钟)连续1–22

三、AI 学习焦虑量表(Anxiety_1 ~ Anxiety_12)

三维结构:认知焦虑(4 题)+ 情感焦虑(4 题)+ 行为回避(4 题)

变量名维度题项内容(示例)反向题
Anxiety_1认知焦虑我担心自己不会使用 AI 工具会影响学业成绩
Anxiety_2认知焦虑看到同学熟练使用 AI 我会感到落后
Anxiety_3认知焦虑我担心 AI 比我更聪明,让我的学习显得无意义
Anxiety_4认知焦虑我相信我能掌控 AI 工具为我服务(5=非常同意 表示 不焦虑🔴 是
Anxiety_5情感焦虑想到要学习使用新 AI 工具我会感到紧张
Anxiety_6情感焦虑AI 相关的新闻让我感到焦虑
Anxiety_7情感焦虑我对 AI 的快速发展感到不安
Anxiety_8情感焦虑我担心未来 AI 会取代我的就业岗位
Anxiety_9行为回避我会刻意回避了解 AI 的最新进展
Anxiety_10行为回避老师让用 AI 完成作业时我会找借口推脱
Anxiety_11行为回避我尽量不在朋友圈讨论 AI 话题
Anxiety_12行为回避我会避开 AI 相关的选修课

关键备注

  • 反向题 Anxiety_4 在清洗时必须执行 Anxiety_4_R = 6 - Anxiety_4
  • 维度归属(用于 EFA 验证):
    • 因子 1(认知):Anxiety_1, 2, 3, 4_R
    • 因子 2(情感):Anxiety_5, 6, 7, 8
    • 因子 3(回避):Anxiety_9, 10, 11, 12

四、学习策略量表(Strategy_1 ~ Strategy_8)

单维结构(含元认知与深度学习策略)

变量名题项内容(示例)反向题
Strategy_1我会在学习前制定具体目标
Strategy_2我会主动检查自己是否真的理解了内容
Strategy_3遇到难题我会尝试多种方法
Strategy_4我会把新知识与已有知识联系起来
Strategy_5我能合理安排学习时间
Strategy_6我会反思自己学习过程中的不足
Strategy_7我会主动寻找额外的学习资源
Strategy_8遇到困难我倾向于放弃(5=非常同意 表示 策略差🔴 是

关键备注

  • 反向题 Strategy_8 在清洗时必须执行 Strategy_8_R = 6 - Strategy_8

五、学业自我效能感量表(Efficacy_1 ~ Efficacy_7)

单维结构

变量名题项内容(示例)反向题
Efficacy_1我相信自己能完成大部分学业任务
Efficacy_2面对难度大的课程我有信心通过
Efficacy_3即使有挫折我也能坚持完成学业目标
Efficacy_4我相信努力可以克服学习中的困难
Efficacy_5我能在期末考试中取得理想成绩
Efficacy_6我有信心独立完成研究性作业
Efficacy_7我经常怀疑自己的学习能力(5=非常同意 表示 效能感低🔴 是

关键备注

  • 反向题 Efficacy_7 在清洗时必须执行 Efficacy_7_R = 6 - Efficacy_7

六、衍生变量(清洗后计算)

变量名计算方式用途
Anxiety_Mean12 题反转后的均值总焦虑得分(中介路径 X)
Anxiety_Cog_Mean题项 1, 2, 3, 4_R 均值认知焦虑维度
Anxiety_Emo_Mean题项 5, 6, 7, 8 均值情感焦虑维度
Anxiety_Avd_Mean题项 9, 10, 11, 12 均值行为回避维度
Strategy_Mean8 题反转后的均值中介变量 M
Efficacy_Mean7 题反转后的均值因变量 Y

七、数据清洗步骤(必做)

  1. 剔除无效样本Duration_Min < 3 或缺失率 > 30% 或规律性应答(如全选同一项)
  2. 处理缺失值:若量表整体缺失 < 5%,使用均值填补;> 20% 整行删除
  3. 反向题反转:Anxiety_4 / Strategy_8 / Efficacy_7 执行 6 - x
  4. 计算总分/均分:见第六节

八、可在本数据上跑通的统计分析(教学演示)

分析方法课次预期结果
描述统计第 24 课三量表均值约 2.8–3.5,标准差 0.65–0.85
独立样本 t 检验第 25 课性别 / 年级差异部分显著
单因素 ANOVA第 25 课专业大类对 Strategy 有显著影响
相关分析第 26 课r(Anx, Str) ≈ −.30, r(Anx, Eff) ≈ −.26, r(Str, Eff) ≈ .42
多元回归第 26 课β(Anx)=−.21, β(Str)=.38, R² ≈ .20
Cronbach's α第 27 课Anxiety ≈ .83, Strategy ≈ .88, Efficacy ≈ .89
EFA(Anxiety 12 题)第 28 课三因子结构清晰,KMO > .8
Bootstrap 中介第 29 课间接效应 ≈ −.15, 95% CI ≈ [−.22, −.09],不含 0

九、伦理与重生成

  • 本数据完全模拟,无真实受访者,可自由用于教学
  • 数据生成代码见 generate_dataset.py,使用 np.random.seed(42) 保证可复现
  • 如需修改样本量、效应量、维度结构,编辑脚本顶部参数后重跑

版本:v3.1 (2026-05) | 维护:跟随 plan v3.x 同步更新

助力学者在 AI 时代极速产出高质量学术成果 · 55 课时双轨制 · plan v3.3