第 1 课：课程导论与 AI 能力边界

🎯 本节核心目标

看清这门课如何带你从「选题」走到「投稿与 Rebuttal」；亲手测出大语言模型在学术任务上的"能力三界"；并产出你的三件随身工具——个人学习路线表、AI 任务分类表、轨道选择结论。

📋 课前准备（5 分钟自检）

账号

[ ] 豆包（必备，中文友好入口）：doubao.com
[ ] 至少一个海外主力平台（任选其一）：
- GPT · chatgpt.com（登录后用默认的主力模型）
- Claude · claude.ai（当前主力 Opus / Sonnet 系列）
- Gemini · gemini.google.com（用当前主力 Pro 版）
[ ] 已能打开本课程网站（你正在看的就是）

💡 模型版本每 3–6 个月就会迭代，本课不把方法绑死在某个版本号上。登录后用各平台当前默认的主力模型即可，操作步骤完全不变；需要查版本基线时见课程大纲第十六条。

工具/环境

[ ] 一台可上网的电脑（Win / Mac / Linux 均可）
[ ] 任意现代浏览器（Chrome / Edge / Safari 最新版）
[ ] 一份记录提示词与产出的本地笔记（Markdown / Word / 飞书文档均可）

数据/素材

[ ] 准备一个你工作或学习中真实卡住的小问题（一段待翻译的文字、一份要缩写的初稿等），本课用它来实操

应急通道

海外平台访问不畅 → 用国产替代：Kimi K2 / DeepSeek（V3 / R1）/ 通义千问
拿不准选哪条轨道 → 完成本课末尾的轨道自测

一、问题引入：为什么第一课先讲"边界"，而不是"技巧"

绝大多数论文里的 AI 事故，不是因为不会用，而是因为不知道它在哪儿靠谱、在哪儿绝不能信。最常见的两类翻车——后面你会亲手复现一次：

编造的"真文献"：AI 给你一段引言，配上格式完美的 APA 参考文献和 DOI 链接。作者、期刊都真实存在，但那篇论文根本不存在。盲审专家随手一搜，露馅。
正确却空洞的"AI 味"：一段读起来很"学术"、其实没有任何观点和证据的综述。内行一眼看出是机器快餐。

这门课的第一件事，就是让你建立对 AI 能力边界的肌肉记忆：把它当"高级加工车间"，而不是"事实采矿点"。把边界搞清楚，后面 54 课的技巧才用得安全。

二、课程导论：这门课会带你产出什么

2.1 一条主线：论文的全生命周期

选题 → 文献 → 研究设计 → 问卷/数据 → 统计分析 → 写作 → 排版 → 投稿 → 审稿应对(Rebuttal) → 归档
└─ 模块二 ─┘ └──── 模块三 ────┘ └─── 模块四 ───┘ └──────── 模块六 ────────┘
   模块一打地基（AI 使用基本功）；模块五（技术进阶轨）补 Git/Python/LaTeX 等工具链

这门课不止教你"把论文写完"，而是陪你走完到投稿、盲审、修回为止的完整链路。

2.2 学完你会带走的"实物"（不是听个热闹）

3 篇贴着投稿水平、经人工核验后可进入投稿流程的完整论文成稿（跟随三条案例主线产出）
1 套你自己的提示词模板库
1 套科研与写作工作流手册（SOP）
1 套批判性使用 AI 的检查清单
1 份 AI 使用合规声明模板 + 1 套 Rebuttal Letter 应对模板
1 套个人高效科研工具箱

2.3 三条案例主线（你将从中任选其一产出论文）

主线	学科	研究问题（示例）	配套数据集
A	心理 / 教育 / 问卷	AI 学习焦虑对学业自我效能的影响——学习策略的中介作用	模拟问卷 N=540
B	经济 / 管理 / 实证	数字经济发展对区域创新能力的影响	省级面板数据
C	计算机 / AI 实验	大模型自动摘要生成的质量评估（技术进阶轨）	300 篇 × 3 模型评估

三套数据集都已配好数据字典、可复现生成脚本与 README，可在本站 数据集下载 一键获取。

2.4 怎么用这个网站

按左侧 sidebar 顺序学，每课 30–45 分钟，自成一个"学完即能做"的单元
每课开头有 📋 课前准备（账号/工具/数据/应急通道），别跳过——它保证你不卡在环境问题上
每课结尾有 📦 交付物，照着提交即可纳入作业评估
看到 ::: code-group 代码块里的提示词，可一键复制直接用
发现错字或有建议 → 用每页底部的"在 GitHub 上提建议"

2.5 贯穿全课的一条红线：批判性使用 + 学术诚信

全课红线

AI 是辅助工具，不是作者。 论文的每一句话、每一个结论，责任都在你。我们教你规范地用 AI 辅助——引用要可查、数据要真实、使用要披露；绝不教代写、伪造数据或规避检测。这既是学术底线，也是你论文能过盲审、不被撤稿的前提。第 8 课会专门讲这条线怎么落地。

三、核心方法：AI 能力"三界碑"——一张你要用一整学期的分类表

3.1 先搞懂底层：它是"语言概率引擎"，不是"事实数据库"

大语言模型（GPT、Claude、Gemini、豆包、DeepSeek 等）的本质，是一个预测"下一个词"的概率引擎：它从海量文本里学会了"在这个语境下，接哪个词最像人会写的"。

这带来一个关键后果：它追求的是"读起来对"，不是"事实上对"。 当你逼它给出它并不"知道"的具体事实（某篇论文的 DOI、某量表的信度数值），它不会说"我不知道"，而会生成一个最像答案的东西——这就是"幻觉（hallucination）"的来源。

联网检索、RAG 等"检索增强"能大幅缓解幻觉（让它先查再答），但不能消除——检索到的内容仍可能被错误拼接。所以无论开不开联网，核心动作只有一个字：验。

3.2 能力三界碑（核心分类表）

把所有 AI 任务，按"能不能信"分进三个区。这张表是本课第一件交付物的底版，请收好。

能力区	典型学术任务	可信度	你必须做的验证动作
🟢 绿区文本加工（你已提供底料）	把你写的中文方法段译成英文；把啰嗦初稿缩写成 150 词摘要；把杂乱访谈整理成结构化要点；校对语法/格式；把你给的 5 篇文献要点按主题归类成表	高	核对术语是否准确、有没有漏掉或擅自添加信息
🟡 黄区长逻辑 / 解读（启发，不可照抄）	读你上传的 PDF 提炼 Research Gap；对比两篇文献的理论分歧；解读你跑出的回归结果；据你的数据提"可能的讨论方向"	中	回原文/原数据按图索骥核对；统计解读自己复算（第 30 课专讲）
🔴 红区凭空事实 / 精密数值（禁止直接采信）	让它"查"文献并给 DOI/页码；报某量表的 Cronbach's α / 信效度；给统计年鉴/政策的具体数字；"计算"你没给原始数据的统计量	极低	一律不直接用：DOI 到 doi.org 验证、数字回官方源、统计量用你自己的数据算

💡 一句话记牢：AI 是材料的**"加工车间"，不是事实的"采矿点"。绿区放手用，黄区核对用，红区先验证再说**。

四、工具演示 + 学员跟做：亲手测出"红区"造假

理论说一百遍，不如自己被骗一次。下面两个任务，请真的去做，把过程记进你的笔记。

跟做任务一：复现一次"隐性学术幻觉"

打开任意平台（推荐豆包 / 通义千问 / DeepSeek 的常规模式，先不要开联网搜索），新建对话，原样发送：

幻觉引文测试（复制发送）

markdown

我在写一篇学位论文，核心立论是："长期使用生成式 AI 会加剧中年知识工作者的存在主义焦虑"。
请写一段 400 字的引言来支撑它，并满足：
1. 引用 3 篇 2022–2024 年发表的真实英文 SSCI 期刊文献；
2. 段末给出这 3 篇文献的标准 APA 参考文献；
3. 每篇附真实可查的 DOI 链接。

▶ 它很可能给你一段格式完美的答案。现在做"验证三连"：

验 DOI：把它给的每个 https://doi.org/10.xxxx/... 链接逐个打开。解析不到、或跳到一篇标题完全不同的论文 → 这条是编的。
验标题：把论文标题原样粘到 Google Scholar 或知网搜。搜不到这个标题 → 编的。
验组合：作者、期刊、年份可能各自真实，但被错误地拼在了一起——这是最隐蔽的一种。

你会观察到的真相

作者（如某领域常发文的学者）和期刊（如 Computers in Human Behavior）往往真实存在，但标题和 DOI 是拼出来的——DOI 到 doi.org 会显示 "DOI Not Found"。这就是最坑人的**"似真造假（plausible fabrication）"**：格式越完美，越危险。直接粘进论文，盲审一搜就露馅。

⚠️ 进阶观察：如果你开了联网搜索再问一遍，模型可能会给出真实文献——但仍需逐条点开验证。"看起来对"永远不等于"真的对"。

跟做任务二：识别"AI 学术塑料味"

新建一个干净窗口，发送：

无素材裸跑测试（复制发送）

markdown

请写一段 500 字的文献综述，主题："社交媒体依赖与中学生抑郁倾向的影响机制"，
要求结构严密、符合期刊基调。

它会在几秒内交卷。请用审稿人的眼光读，对照下面这张"AI 味"识别清单打钩：

[ ] 套话连接词："近年来""引起学界广泛关注""在日益复杂的环境下""综上所述，未来研究应进一步……"
[ ] 没有真矛盾：通篇在用不同长句重复"影响很大"这个常识，没有呈现学派分歧（如 A 派认为正相关、B 派指出某条件下负相关）
[ ] 虚假精确：给出看似具体、实则无出处的"研究表明 73% 的……"
[ ] 缺具体证据：没有任何一个可追溯的研究、数据或情境

勾中 2 项以上，就是典型"AI 味"。 根因：你没给骨架和限定，它只能输出"标准作文的平均值"。

五、批判性复核：本节高风险点

做完任何一次 AI 任务，养成"复核三问"：

事实可查吗？（红区内容一律按"验证三连"核对）
逻辑自洽吗？（黄区结论回原文/原数据核对）
引用真实吗？（每条引用都要能在数据库找到原文）

承上启下

你现在有了"边界意识"。第 3 课会把它升级成一套可复用的系统提示词框架（S-P-O / BROF），把"知道该验"变成"每次开局自动就位"。本课末尾先给你一份精简版对齐指令收藏。

六、成果沉淀：本课三件交付物

交付物 1：个人学习路线表

复制下表到你的笔记，填好——它决定你后面怎么学、产出什么。

项目	你的填写
我的研究方向 / 学科
目标期刊层次（中文核心 / CSSCI / SSCI / 会议）
我选的轨道（通识 / 技术进阶，做完第七节自测后填）
每周可投入学习时间
我打算跟哪条案例主线产出论文（A / B / C / 我自己的课题）
学完最想拿到的 1 个具体成果
我当前最大的卡点（选题 / 文献 / 数据 / 写作 / 投稿）

交付物 2：AI 任务分类表

从第三节的"三界碑"出发，列出你自己 10 个高频任务，逐个分到绿/黄/红区，并写明验证动作。例如：

我的高频任务	能力区	验证动作
把中文摘要译成英文	🟢	核对专业术语
让 AI 提炼我上传文献的 Gap	🟡	回原文核对
让 AI 给某主题的参考文献	🔴	doi.org 逐条验证（基本不用）
…（补满到 10 条）

交付物 3：轨道自测表（结论回填交付物 1）

完成第七节的 5 题自测，把判定出的轨道结论填回交付物 1。

📦 提交清单（AI 初审 + 讲师抽检，按 Module_Rubrics.md 评分）

[ ] 个人学习路线表（已填）
[ ] AI 任务分类表（≥10 条，含验证动作）
[ ] AI 协作日志：任务一的"指令 → AI 输出 → 你的验证结论"完整记录
[ ] 一条你亲手测出的幻觉记录（哪个 DOI 是假的、怎么验出来的）
[ ] 轨道自测表结论

⏱️ 时间建议：跟做任务一在课中完成；跟做任务二与三张表可作课后作业，避免单节超时。

七、轨道自测：你该走通识轨还是技术进阶轨？

本课程为双轨制：

通识轨（47 课）：聚焦"搞定论点撰写与跑出结果"，用 Jamovi / JASP 等免代码工具 + Word 排版
技术进阶轨（55 课）：在通识轨基础上，额外掌握 Git / Python / Jupyter / LaTeX / AI 编码代理等完整工具链

核心提醒：两轨的方法论与论文产出目标完全一致，差异只在工具深度。进阶不代表水平高，通识不等于水平低。选工具只有一个标准——在限定时间内，什么工具能最平滑、最少报错地帮你拿到录用通知。

5 题自测（请如实勾选）

#	问题	是	否
1	你是否打开并用过电脑的命令行（Windows 的 PowerShell/CMD 或 Mac 的 Terminal）？	☐	☐
2	你是否亲自安装过 Python 等编程环境？	☐	☐
3	你是否写过 10 行以上能跑通的任何语言代码？	☐	☐
4	你的研究方向是否涉及大数据运算、自定义爬虫、算法训练等常规可视化统计软件覆盖不了的领域？	☐	☐
5	你是否愿意为本课额外多投入 20–30% 精力去磕代码报错、查环境配置？	☐	☐

判定规则

"是"的数量	推荐轨道	学习内容
≥ 3	🎯 技术进阶轨（55 课）	系统学 Git、Python、Jupyter、LaTeX 与 AI 编码代理
≤ 2	🎯 通识轨（47 课）	聚焦 Jamovi、Word、问卷工具完成全部分析与论文（跳过模块五）

📋 课后任务

把自测结果与最终选择记进交付物 1（个人学习路线表）
第 18 课"数据分析工具选型"会直接对应你此处的选择安装工具
中途可调：如发现选错，在第三模块前都能切换（建议尽早决定，避免重学）

完整自测表与说明也可在 Course_Materials/Templates_and_Checklists/Track_Self_Assessment.md 查阅。

🏁 课后自检清单

下线前，对照复盘：

[ ] 我理解 AI 是"语言概率引擎"，会"似真造假"，绝不再让它凭空给带出处的 DOI 文献当事实用
[ ] 我能凭"套话连接词 + 没有真矛盾"嗅出文章里的"AI 学术味"
[ ] 我已用"验证三连"（验 DOI / 验标题 / 验组合）亲手抓出至少一条幻觉
[ ] 我已填好个人学习路线表，并选定了学习轨道
[ ] 我已收藏下面这段防幻觉对齐指令，作为今后每次开新对话的"开局首发"（第 3 课会展开成完整框架）

防幻觉对齐指令（开局首发，收藏）

markdown

【学术合规预设协议】
在本次对话中，请严格遵守以下四条，同意请只回复"协议已锁定，等待材料"：
1. 事实与引用，由我提供原文或数据来支撑；
2. 当我的问题超出我提供的材料范围时，立即停止推断，并回复"⚠️ 超出已提供材料范围，不臆测"；
3. 若我提供的材料逻辑有漏洞，请直接以学术批判视角指出，不要顺着错误往下推；
4. 输出去除"然而、在这个复杂的时代、带来了深远影响、综上所述"等冗余抒情连接词，保持凝练、客观、可核查。

🎓 本课小结：你已经看清这门课的全貌，建立了 AI 能力的"三界碑"判断力，并产出了三件随身工具。下一课起，我们正式开练——从最友好的入口"豆包"开始。

第 1 课：课程导论与 AI 能力边界 ​

📋 课前准备（5 分钟自检） ​

账号 ​

工具/环境 ​

数据/素材 ​

应急通道 ​

一、问题引入：为什么第一课先讲"边界"，而不是"技巧" ​

二、课程导论：这门课会带你产出什么 ​

2.1 一条主线：论文的全生命周期 ​

2.2 学完你会带走的"实物"（不是听个热闹） ​

2.3 三条案例主线（你将从中任选其一产出论文） ​

2.4 怎么用这个网站 ​

2.5 贯穿全课的一条红线：批判性使用 + 学术诚信 ​

三、核心方法：AI 能力"三界碑"——一张你要用一整学期的分类表 ​

3.1 先搞懂底层：它是"语言概率引擎"，不是"事实数据库" ​

3.2 能力三界碑（核心分类表） ​

四、工具演示 + 学员跟做：亲手测出"红区"造假 ​

跟做任务一：复现一次"隐性学术幻觉" ​

跟做任务二：识别"AI 学术塑料味" ​

五、批判性复核：本节高风险点 ​

六、成果沉淀：本课三件交付物 ​

交付物 1：个人学习路线表 ​

交付物 2：AI 任务分类表 ​

交付物 3：轨道自测表（结论回填交付物 1） ​

七、轨道自测：你该走通识轨还是技术进阶轨？ ​

5 题自测（请如实勾选） ​

判定规则 ​

🏁 课后自检清单 ​

第 1 课：课程导论与 AI 能力边界

📋 课前准备（5 分钟自检）

账号

工具/环境

数据/素材

应急通道

一、问题引入：为什么第一课先讲"边界"，而不是"技巧"

二、课程导论：这门课会带你产出什么

2.1 一条主线：论文的全生命周期

2.2 学完你会带走的"实物"（不是听个热闹）

2.3 三条案例主线（你将从中任选其一产出论文）

2.4 怎么用这个网站

2.5 贯穿全课的一条红线：批判性使用 + 学术诚信

三、核心方法：AI 能力"三界碑"——一张你要用一整学期的分类表

3.1 先搞懂底层：它是"语言概率引擎"，不是"事实数据库"

3.2 能力三界碑（核心分类表）

四、工具演示 + 学员跟做：亲手测出"红区"造假

跟做任务一：复现一次"隐性学术幻觉"

跟做任务二：识别"AI 学术塑料味"

五、批判性复核：本节高风险点

六、成果沉淀：本课三件交付物

交付物 1：个人学习路线表

交付物 2：AI 任务分类表

交付物 3：轨道自测表（结论回填交付物 1）

七、轨道自测：你该走通识轨还是技术进阶轨？

5 题自测（请如实勾选）

判定规则

🏁 课后自检清单