第 18 课:数据分析工具选型与环境准备
🎯 核心实操目标
通关要求:彻底切断选择困难症。我们正式进入本套课程最硬核的数据运算大图景。本课结束时,你需要依据自身当前的数理基础与时间资源,在两条截然不同的工具跑道中做出明智抉择,并在自己的电脑上完成部署与初体验。
📋 课前准备(5 分钟自检)
账号/工具
- [ ] Jamovi 2.5+(通识轨主推):jamovi.org
- [ ] SPSS 29+(备用,学校常有授权)
- [ ] Anaconda + Jupyter(技术进阶轨)
数据
- [ ] Case A 数据集(本模块主用):case_A_questionnaire.csv
- [ ] Case A 数据字典:case_A_data_dictionary.md
- [ ] 自己的真实问卷数据(如已收集)
AI 辅助平台
- [ ] Claude 4.8 / GPT-5(用作"学术翻译官"翻译统计输出)
应急通道
- 安装失败 → 用 JASP 替代 Jamovi(同源、免费)
- 数据导入报错 → 转 CSV UTF-8 编码再导入
- 跑出来不显著 → 不要改数据,回到本课检查清洗步骤
场景痛点破冰:选错工具,比不会用更耽误事
"到了跑数据这一关,很多初学者还在纠结要不要去买个 SPSS,对着复古界面发怵; 或者被导师要求用 Python 做回归,结果光是配 conda 环境就折腾了三周,一个库版本冲突整个环境崩掉,一行结果都没跑出来,最后彻底放弃。
在大模型时代,选一件适合自己基础的趁手工具,比硬学任何技术都重要。文科/社科零基础学员,完全可以用免费、零代码的 Jamovi 跑出和 SPSS 一样规范的结果。"
🗺️ 架构重组:三大工具赛道的极限对比
🚀 拆解实战:选定 Jamovi 并完成第一次分析体验
📋 本课强烈推荐的标准路线:本套核心实战课全量适配免费、开源的 Jamovi。它底层跑的是 R 的统计核心,但界面是纯图形化、零代码;最实用的一点是——改一个变量类型,所有依赖它的图表会自动重算,不用重跑。
动作流一:零障碍安装部署(5分钟)
- 打开浏览器访问:
https://www.jamovi.org/ - 点击页面上的 Download 按钮
- 选择带有
Solid标识的稳定版(不要选 Current,那是开发测试版) - Windows 用户下载
.exe安装包,Mac 用户下载.dmg,双击无脑安装,不需要任何破解 - 安装完毕,桌面出现粉色/紫色图标,点击打开
动作流二:导入 Case A 数据,完成第一次描述统计
💡 配套数据
本课用课程主数据集 Case A(大学生 AI 学习焦虑问卷,N=540;课前准备里已下载 case_A_questionnaire.csv)。把它拖进 Jamovi 即可开始。
Step 1 - 导入数据:把 case_A_questionnaire.csv 直接拖拽进 Jamovi 主界面,数据立刻以电子表格呈现。
Step 2 - 跑描述统计:点击顶部 【Exploration(探索)】→【Descriptives(描述统计)】。
Step 3 - 勾选变量:把左侧 Age(年龄)、Anxiety_1(焦虑题1) 拖进右侧 "Variables" 框,下方勾选 Histogram(直方图)。
预期产出(右侧实时出表,你跑出来应是这个量级):
| Variable | N | Mean | SD | Min | Max |
|---|---|---|---|---|---|
| Age | 540 | 20.6 | 1.6 | 18 | 24 |
| Anxiety_1 | 540 | 3.18 | 0.94 | 1 | 5 |
直方图应大致呈钟形(近似正态)。如果某个量表题均值贴着 1 或 5、或直方图严重偏向一边,先别急着分析——回头检查是不是漏了反向题处理(第 23 课)。 这一步只是"看一眼数据长什么样",真正的清洗在后面。
动作流三:用 AI 把数字翻译成方法段(走通一个正例)
把 Jamovi 的描述统计结果(或上面的数字)配合提示词发给 AI:
我是一名研究生,用 Jamovi 跑了变量的描述统计。以下是输出数字:
N=540,Age 均值 20.6 (SD=1.6);Anxiety_1 均值 3.18 (SD=0.94)。
请用专业学术语言,翻译成可直接写进论文"研究方法 / 样本描述"的一段话(约100字),句式参考:
"本研究共回收有效问卷…份,受访者平均年龄…岁(SD=…)……"AI 应给你这样一段(正例):
本研究共回收有效问卷 540 份。受访者平均年龄为 20.6 岁(SD = 1.6),介于 18–24 岁之间,符合在校大学生群体特征。在 AI 学习焦虑首题上,样本均值为 3.18(SD = 0.94),处于五点量表的中间偏上水平,初步显示受访者存在一定程度的 AI 学习焦虑。
⚠️ AI 只负责把你已跑出来的数字翻译成学术语言;绝不要把原始数据丢给它让它"帮你算"——它会编造统计量(这条边界第 30 课还会强调)。
📦 本课交付物(提交给 AI 初审/讲师抽检)
按本节实操任务完成并提交以下内容,AI 初审 + 讲师抽检按 Module_Rubrics.md 对应维度评分:
- [ ] 本节实操产出:本节任务区块要求的具体文件 / 文本 / 截图
- [ ] AI 协作日志:至少 1 段完整的"任务描述 → AI 输出 → 人工修正"对话记录
- [ ] 四维质检记录:用
Course_QA_Checklists.md(事实/逻辑/格式/引用)核查本节 AI 输出的笔记 - [ ] 沉淀模板:将本课关键 Prompt / 流程 / 检查清单加入你的个人工具箱
🏁 小结与自测 (Milestone Checklist)
- [ ] 我已经审视了自己的学科背景,认清了选择适合自己工具的重要性,不再盲目跟风学 Python。
- [ ] 我已成功在电脑上安装并打开了 Jamovi,看到了第一个数据界面。
- [ ] 我已经完成了把一份数据拖入 Jamovi → 跑描述统计 → 出图 → 截图给 AI 翻译的完整闭环。
- [ ] 我明白了 AI 在这里的角色是"翻译官",而不是"代运算员"。
