Skip to content

第 18 课:数据分析工具选型与环境准备

🎯 核心实操目标

通关要求:彻底切断选择困难症。我们正式进入本套课程最硬核的数据运算大图景。本课结束时,你需要依据自身当前的数理基础与时间资源,在两条截然不同的工具跑道中做出明智抉择,并在自己的电脑上完成部署与初体验。

📋 课前准备(5 分钟自检)

账号/工具

  • [ ] Jamovi 2.5+(通识轨主推):jamovi.org
  • [ ] SPSS 29+(备用,学校常有授权)
  • [ ] Anaconda + Jupyter(技术进阶轨)

数据

AI 辅助平台

  • [ ] Claude 4.8 / GPT-5(用作"学术翻译官"翻译统计输出)

应急通道

  • 安装失败 → 用 JASP 替代 Jamovi(同源、免费)
  • 数据导入报错 → 转 CSV UTF-8 编码再导入
  • 跑出来不显著 → 不要改数据,回到本课检查清洗步骤

场景痛点破冰:选错工具,比不会用更耽误事

"到了跑数据这一关,很多初学者还在纠结要不要去买个 SPSS,对着复古界面发怵; 或者被导师要求用 Python 做回归,结果光是配 conda 环境就折腾了三周,一个库版本冲突整个环境崩掉,一行结果都没跑出来,最后彻底放弃。

在大模型时代,选一件适合自己基础的趁手工具,比硬学任何技术都重要。文科/社科零基础学员,完全可以用免费、零代码的 Jamovi 跑出和 SPSS 一样规范的结果。"


🗺️ 架构重组:三大工具赛道的极限对比

你的背景与需求是什么?零基础 / 文科 / 商科✅ Jamovi免费·零代码·图形界面导师硬性要求 SPSS⚠️ SPSS(付费)老牌工具·贵·界面复古理工科 / 大数据 / 机器学习🔬 Python/R代码控·无上限·学习曲线陡

🚀 拆解实战:选定 Jamovi 并完成第一次分析体验

📋 本课强烈推荐的标准路线:本套核心实战课全量适配免费、开源的 Jamovi。它底层跑的是 R 的统计核心,但界面是纯图形化、零代码;最实用的一点是——改一个变量类型,所有依赖它的图表会自动重算,不用重跑

动作流一:零障碍安装部署(5分钟)

  1. 打开浏览器访问:https://www.jamovi.org/
  2. 点击页面上的 Download 按钮
  3. 选择带有 Solid 标识的稳定版(不要选 Current,那是开发测试版)
  4. Windows 用户下载 .exe 安装包,Mac 用户下载 .dmg,双击无脑安装,不需要任何破解
  5. 安装完毕,桌面出现粉色/紫色图标,点击打开

动作流二:导入 Case A 数据,完成第一次描述统计

💡 配套数据

本课用课程主数据集 Case A(大学生 AI 学习焦虑问卷,N=540;课前准备里已下载 case_A_questionnaire.csv)。把它拖进 Jamovi 即可开始。

Step 1 - 导入数据:把 case_A_questionnaire.csv 直接拖拽进 Jamovi 主界面,数据立刻以电子表格呈现。

Step 2 - 跑描述统计:点击顶部 【Exploration(探索)】→【Descriptives(描述统计)】

Step 3 - 勾选变量:把左侧 Age(年龄)Anxiety_1(焦虑题1) 拖进右侧 "Variables" 框,下方勾选 Histogram(直方图)

预期产出(右侧实时出表,你跑出来应是这个量级):

VariableNMeanSDMinMax
Age54020.61.61824
Anxiety_15403.180.9415

直方图应大致呈钟形(近似正态)。如果某个量表题均值贴着 1 或 5、或直方图严重偏向一边,先别急着分析——回头检查是不是漏了反向题处理(第 23 课)。 这一步只是"看一眼数据长什么样",真正的清洗在后面。

动作流三:用 AI 把数字翻译成方法段(走通一个正例)

把 Jamovi 的描述统计结果(或上面的数字)配合提示词发给 AI:

markdown
我是一名研究生,用 Jamovi 跑了变量的描述统计。以下是输出数字:
N=540,Age 均值 20.6 (SD=1.6);Anxiety_1 均值 3.18 (SD=0.94)。
请用专业学术语言,翻译成可直接写进论文"研究方法 / 样本描述"的一段话(约100字),句式参考:
"本研究共回收有效问卷…份,受访者平均年龄…岁(SD=…)……"

AI 应给你这样一段(正例):

本研究共回收有效问卷 540 份。受访者平均年龄为 20.6 岁(SD = 1.6),介于 18–24 岁之间,符合在校大学生群体特征。在 AI 学习焦虑首题上,样本均值为 3.18(SD = 0.94),处于五点量表的中间偏上水平,初步显示受访者存在一定程度的 AI 学习焦虑。

⚠️ AI 只负责把你已跑出来的数字翻译成学术语言;绝不要把原始数据丢给它让它"帮你算"——它会编造统计量(这条边界第 30 课还会强调)。


📦 本课交付物(提交给 AI 初审/讲师抽检)

按本节实操任务完成并提交以下内容,AI 初审 + 讲师抽检按 Module_Rubrics.md 对应维度评分:

  • [ ] 本节实操产出:本节任务区块要求的具体文件 / 文本 / 截图
  • [ ] AI 协作日志:至少 1 段完整的"任务描述 → AI 输出 → 人工修正"对话记录
  • [ ] 四维质检记录:用 Course_QA_Checklists.md(事实/逻辑/格式/引用)核查本节 AI 输出的笔记
  • [ ] 沉淀模板:将本课关键 Prompt / 流程 / 检查清单加入你的个人工具箱

🏁 小结与自测 (Milestone Checklist)

  • [ ] 我已经审视了自己的学科背景,认清了选择适合自己工具的重要性,不再盲目跟风学 Python。
  • [ ] 我已成功在电脑上安装并打开了 Jamovi,看到了第一个数据界面。
  • [ ] 我已经完成了把一份数据拖入 Jamovi → 跑描述统计 → 出图 → 截图给 AI 翻译的完整闭环。
  • [ ] 我明白了 AI 在这里的角色是"翻译官",而不是"代运算员"。

助力学者在 AI 时代极速产出高质量学术成果 · 55 课时双轨制 · plan v3.3