第 5 课:工作场景实战(二)方案与汇报
🎯 核心实操目标
学习目标:应对“面对一片空白文档无从下笔”的写作焦虑(Writer's Block)。在本课结束时,你需要掌握大语言模型的“骨架与填充的增量写作法”,学会先用 AI 构建一份逻辑严密的提纲骨架,再对局部内容逐节补写。
📋 课前准备(5 分钟自检)
账号
- [ ] 豆包(必备,国内零基础友好):doubao.com
- [ ] 至少一个海外平台账号(任选其一):GPT-5 / Claude 4.8 / Gemini 2.5
工具/环境
- [ ] 一台可上网的电脑(Windows / Mac / Linux 均可)
- [ ] 任意浏览器(推荐 Chrome / Edge / Safari 最新版)
- [ ] 一份用于记录提示词与对话的本地笔记(Markdown / Word / Notion)
数据/素材
- [ ] 一段你自己工作/学习中真实卡住的文字问题(用作实操对象)
应急通道
- 海外平台无法访问 → 用国产替代:Kimi K2 / DeepSeek V3 / 通义千问
- 浏览器卡顿 → 关闭其他标签后重试,AI 网页对内存敏感
- 不会注册 → 加入课程答疑群索取注册教程
场景导入:为什么它写的长篇大论总是“假大空”?
导师对你说:“马上要申报明年的国家社科/自科基金项目了,你先想一个研究大纲给我看看。” 面对一个空白的 Word 文档,你一天也写不出三行字。无奈之下,你直接对大模型说:“给我写一篇探讨元宇宙对实体经济影响的社科基金申请书,8000 字。”
结果它生成了一堆看似宏大、实则空洞、难以落地的排比句。为什么?因为这相当于让厨师在没有菜单设计的情况下,一口气做出 100 道菜。更可行的做法,是先从敲定提纲骨架开始。
骨架与填充的增量写作漏斗
向 AI 索要篇幅较长且专业性较强的内容时,宜采用“树状拆解”的思路,不宜一次性下达全量生成指令:
🧠 原理:为什么"先骨架后填充"更可控
要理解这套方法,先理解大模型是怎么生成文字的。可以这样通俗地理解它的工作方式:它按训练语料里的统计规律,一个词一个词地预测"接下来最可能出现什么"——它追求的是"读起来通顺、像训练里见过的样子",而不是"内容真实、论证扎实"。把这一点放在心上,三阶段漏斗为什么有效就一目了然:
- 一次性长文 → 为什么容易"假大空"。 当指令是"写一篇 8000 字申请书"时,"靶面"过大、约束过少。在缺少具体抓手的情况下,模型倾向于回退到训练语料中高频、安全、放之四海皆准的表达——也就是宏大排比、形容词堆砌。这些句子在统计上"最像一篇申请书该有的样子",却未必对你这个具体课题有信息量。换句话说,空话不是模型"偷懒",而是约束太弱时的概率默认值。
- 先要骨架 → 为什么逻辑更稳。 让它只产出一、二级标题,等于把任务切成一个小而明确的子问题。生成量小、可一眼通读,你就能在填肉前对整体逻辑把关——而结构的取舍恰恰最需要人的判断。
- 逐节填充 → 为什么内容更实。 当指令收窄到"只写 1.1、800 字、含某个具体论点"时,模型的预测被你给的约束牢牢框住,更难滑回万能空话。靶面越小,越可控——这正是漏斗每一步都在做的事。
- 为什么数字仍要核对。 同一套机制也解释了它的软肋:模型没有接入一个可信的事实数据库,它生成的样本量、系数、文献只是"读起来对"的词,未必对应真实来源(这种一本正经编造的现象称为幻觉 hallucination,见下)。所以填肉再顺,具体数字与出处仍须回原始数据/文献核对。
📐 本节关键术语
- 增量写作(incremental writing)/ 大纲优先(outline-first):不一次性索取长文,而是先生成结构骨架、再逐节补写内容的协作方式。本节漏斗即其具体落地。
- 上下文窗口(context window):模型在本轮对话中能"看到"并据以生成的全部文字范围。本节"在同一对话里只改 4.2、其余不动"之所以可行,正是因为前面敲定的骨架还在上下文窗口内、模型仍能参照。
- 幻觉(hallucination):模型生成了通顺、自信、但与事实不符的内容(如杜撰的数字、不存在的文献)。它源于"预测下一个词"而非"查证事实",是黄区核对存在的根本原因。
- 负向提示(negative prompting):在指令中明确写出"不要做什么"(如"不要写正文""不要堆排比")来约束输出,与本节阶段一"绝不要正文"一脉相承。
拆解实战:从一张白纸到万字课题申报书架构
📋 示例场景:你需要起草一份以“生成式大模型介入中小学基础教育后的心理影响”为主题的省级课题申报大纲。目前的 Word 文档还是空白。
【第一阶段】:搭建骨架
先不索取正文,而是要求它先输出目录骨架。
【身份设定】你是一位评审过无数省级重大课题的教育部社科规划核心专家组成员。
【任务指令】
我需要撰写一份关于“生成式AI介入中小学基础教育对学生心智发育的负向剥夺影响”的省级教改课题申报书。
目前处于初步构思阶段,你需要充当我的头脑风暴助手。
**执行要求**:
绝对不要给我写正文!请直接为我提供一份具备极强学术性、能够吸引盲审专家眼球的申报书【骨架大纲】。
请精确生成 5 大核心模块(如立项依据、研究方法等)的一级与二级标题。要求标题紧凑、动词前置、极具学术张力。📄 AI 真实生成的骨架大纲全文(仅一、二级标题,未含正文)—— 点击展开
这是上面那条提示词生成的真实骨架。请记住它,因为第二阶段要修订的就是这里的 4.2。
# 生成式 AI 介入中小学基础教育对学生心智发育的负向剥夺影响
## 省级教改课题申报书 · 骨架大纲
一、立项依据:被技术红利遮蔽的认知剥夺危机
1.1 选题缘起——从"提效神器"到"思维拐杖"的隐忧
1.2 国内外研究现状述评与既有研究的三处盲区
1.3 研究的理论价值与现实紧迫性
二、概念厘定与理论框架
2.1 核心概念界定:"心智剥夺"与"认知卸载"的边界
2.2 理论基础:建构主义学习观 × 认知负荷理论
2.3 研究假设与分析模型的提出
三、研究目标、研究内容与拟突破的关键问题
3.1 总体研究目标与三个子目标
3.2 研究内容的四个递进层次
3.3 拟突破的关键问题与创新点
四、研究方案与技术路线
4.1 总体研究设计与研究对象抽样
4.2 量化问卷收集
4.3 数据处理与统计分析策略
4.4 研究的信度、效度与伦理保障
五、研究基础、进度安排与预期成果
5.1 前期研究积累与团队条件
5.2 三阶段进度甘特安排
5.3 预期成果形式与社会效益【第二阶段】:局部审视与修订
拿到生成的骨架后,你发现它关于“研究方法”的那一块比较传统,仍是发问卷、访谈。你可以随即在现有对话框内对这一单点进行定向修订。
这份大纲相当惊艳!但是,我觉得第四大块里面的二级标题“4.2 量化问卷收集”太陈旧了。
请只针对这个二级子条目进行头脑风暴,请帮我生成 3 个更具前沿性、更新颖的研究干预方法(比如能否用到“脑电眼动仪追踪算法”?)来替代它。其余大纲保持不变。【第三阶段】:逐节填充内容
当你和 AI 通过多轮打磨,把整套大纲修订得严谨完整后,高效的自动化生成才真正开始。
现在,我们的大纲骨架已完全确定。
请根据刚才敲定的大纲【第一章:立项依据与当前学界忽视的理论漏洞】这一截断面,为我撰写 800 字的详细正文初稿。
要求:语气沉稳客观,必须包含对目前中小学内盲目滥用ChatGPT乱象的批判性推演。开始撰写。📝 AI 真实"填肉"正文节选(约 360 字)+ 绿区 / 黄区标注 —— 点击展开
这是第三阶段那条"填肉"提示词生成的第一章正文初稿节选。读法:🟢 绿区=措辞稳妥、可直接保留;🟡 黄区=AI 替你补出来的数字/出处,必须回原数据或文献核对后才能用。
生成式 AI 工具正以前所未有的速度渗入中小学课堂。当学生习惯于将作文构思、数学解题乃至阅读理解一并"外包"给对话框时,一个被技术红利长期遮蔽的问题浮出水面:便捷的认知卸载,是否正在悄然剥夺青少年本应在试错中发育的高阶思维能力? 🟢
既有研究多聚焦于工具的"提效"一面,却普遍忽视其对学习策略的反向侵蚀。本课题组前期在一项面向 500 名(🟡 此处样本量须与最终回收问卷核对,前期预调研实际有效样本为该量级)学习者的相关分析中观察到:AI 学习焦虑(
Anxiety_Mean)与学业自我效能感(Efficacy_Mean)呈显著负相关,r ≈ −.26 🟡(数字源自前期 Case A 数据,正式申报前须用最终样本重新估计并报告 p 值)。这一线索提示,盲目依赖并非无代价。 🟢更值得警惕的是,当学习策略(
Strategy_Mean)这一中介环节被工具替代后,焦虑对效能感的负向传导可能被进一步放大 🟢——这正是当前中小学内 ChatGPT 类工具"有求必应、代劳到底"的使用乱象中,最容易被家长与教师低估的一重风险。 🟢
怎么用这段:
| 片段 | 判定 | 处置动作 |
|---|---|---|
| "便捷的认知卸载是否正在剥夺高阶思维"等论证句 | 🟢 绿区 | 直接保留,至多润色语气 |
| "500 名" 样本量 | 🟡 黄区 | 回收问卷定稿后回填真实 N,删去占位说明 |
| "r ≈ −.26" 相关系数 | 🟡 黄区 | 回 Case A 跑相关分析复核,补 p 值 / 显著性 |
Anxiety_Mean / Efficacy_Mean / Strategy_Mean 变量名 | 🟢 绿区 | 与数据字典一致,可直接沿用 |
⚠️ 基本原则:AI 填充的内容里,凡是具体数字、出处、人名、年份,一律默认按黄区处理。它擅长把话说得通顺,但不对真伪负责——核对的责任始终在你。
💡 【小结】
通过这套方法,你扮演的是项目的整体设计者:把具体的“逐字撰写”工作交给 AI,而自己把控各部分的发展方向。这正是一个不被 AI 牵着走的研究者应有的工作方式。
三个阶段,逐一对照「写砸 vs 写好」
漏斗的三步,每一步都有一种"看似省事、实则把活做砸"的写法。下面针对每一步给出具体对照,照着改就能把手艺练出来。
阶段一·要骨架时——别要正文,也别让标题停在万能词上:
| ❌ 容易写砸 | ✅ 写好 | |
|---|---|---|
| 指令边界 | "帮我写一份课题申报书"(AI 直接给你 8000 字正文) | "只给一、二级标题,绝不要正文" |
| 标题措辞 | "研究背景""研究意义"(任何课题都能套) | "立项依据:被技术红利遮蔽的认知剥夺危机"(动词/判断前置,绑定本题) |
| 颗粒度 | 只有五个一级标题,二级缺位 | 一级下挂 2–4 个二级,骨架能直接往里填肉 |
阶段二·改局部时——别推翻重来,只点名改一处:
| ❌ 容易写砸 | ✅ 写好 | |
|---|---|---|
| 修订范围 | "这版不行,重写一份"(骨架推倒,前功尽弃) | "只改 4.2 这一条,其余保持不变" |
| 给方向 | "改得新颖一点"(AI 不知往哪改) | "把'量化问卷收集'换成 3 个更前沿的干预方法,如脑电/眼动追踪" |
| 一次改几处 | 一口气让它重排五个章节 | 一次只锁一个二级条目,改完再看下一个 |
阶段三·填正文时——别一句话填一整章,指明截面、长度与语气:
| ❌ 容易写砸 | ✅ 写好 | |
|---|---|---|
| 填充单位 | "把整份大纲都写出来" | "只写第一章 1.1这一节" |
| 给约束 | "写详细一点" | "800 字、语气沉稳客观、含对滥用乱象的批判性推演" |
| 用数据 | 放任 AI 自己编样本量和系数 | 让它留占位(如样本量、r 值),事后回数据集核对(见黄区原则) |
📌 一句话记忆:阶段一管"绝不写正文",阶段二管"只改一处",阶段三管"只填一节"。三步都是在给 AI"缩小靶面"。
⚖️ 反例对照:同一段,"一口气 8000 字" vs "先骨架后填肉"
仅说"分步更好"还不够具体。下面把两种写法的真实产出放在一起,看同样写"立项依据"的开头,差距究竟在哪。
🅰️ 反面示例:一次性"写 8000 字"得到的空洞排比(节选)—— 点击展开
提示词:
给我写一篇探讨生成式AI影响中小学教育的省级课题申请书,8000字。AI 直接铺开,得到如下典型片段:
在这个日新月异、波澜壮阔的伟大时代,人工智能的浪潮以排山倒海之势席卷而来,深刻地、全方位地、革命性地改变着教育的方方面面。基础教育作为立德树人的主阵地,作为千秋万代的奠基工程,作为民族复兴的根本所在,必须、也必然要拥抱这场前所未有的深刻变革。我们要以高度的责任感、强烈的使命感、深沉的紧迫感,全面审视、深入思考、系统谋划人工智能与基础教育深度融合的宏伟蓝图……
这段为什么不可用:
- 通篇排比、形容词堆砌,没有一个具体变量、一条数据、一处文献;
- 任何课题、任何学科都能套用——也就意味着对这个课题没有价值;
- "全面、深入、系统"等词换成别的主题同样成立,评审专家一眼就能看出。
🅱️ 正面对照:走完三阶段漏斗后得到的同一段开头 —— 点击展开
同样写"立项依据"的开头,但先锁 4.1 的骨架、再定向填肉(即上文 📝 那段):
生成式 AI 工具正以前所未有的速度渗入中小学课堂。当学生习惯于将作文构思、数学解题乃至阅读理解一并"外包"给对话框时,一个被技术红利长期遮蔽的问题浮出水面:便捷的认知卸载,是否正在悄然剥夺青少年本应在试错中发育的高阶思维能力?本课题组前期相关分析提示,AI 学习焦虑(
Anxiety_Mean)与学业自我效能感(Efficacy_Mean)呈显著负相关(r ≈ −.26),盲目依赖并非无代价……
这段为什么能用:
- 落到了具体研究问题(认知卸载 vs 高阶思维),不是口号;
- 带真实变量与方向性证据(
Anxiety_Mean、Efficacy_Mean、r ≈ −.26),可被核对、可被反驳; - 即使其中的数字仍是黄区(待复核),它至少指向了一处可验证的事实,而 🅰️ 连可验证的对象都没有。
一眼看清差距:
| 对照维度 | 🅰️ 一口气 8000 字 | 🅱️ 先骨架后填肉 |
|---|---|---|
| 单位篇幅信息量 | 极低(形容词/排比注水) | 高(每句指向具体问题或证据) |
| 是否含可核对事实 | 无 | 有(变量名 + r ≈ −.26,标注黄区待核) |
| 能否换个课题照抄 | 能(万能空话) | 不能(绑定本课题数据) |
| 盲审专家观感 | "假大空",扣分 | 有的放矢,有据可循 |
| 你的可控性 | 整篇推倒重来 | 单点回炉,骨架不动 |
📌 结论:分步不是为了"慢",而是为了让 AI 每次只针对一个目标明确的小问题发力——目标越具体,它越不容易写出空话。这正是“骨架与填充”漏斗真正省时间的地方。
换个学科走一遍:经管项目方案(用 Case B 面板数据)
上面的例子是教育/社科的课题申报书。换成经管的项目研究方案,漏斗一模一样——只是骨架的章节名、填肉时引用的数据换了。这里用课程的 Case B(30 省 × 10 年面板,列含 DigEcon_Index 数字经济指数、HumanCap_per10k 每万人人力资本、Innovation_Index 区域创新指数)走一遍。
📋 示例场景:你要给课题组起草一份《数字经济发展对区域创新能力的影响——基于 30 省面板数据》的研究方案,文档还是空白。
阶段一:先要骨架(中文提示词)
【身份设定】你是一位长期评审国家自然科学基金管理学部(G02)面上项目的资深评审专家。
【任务指令】
我要写一份《数字经济发展对区域创新能力的影响——基于30省10年面板数据》的项目研究方案。
我手上的数据是省级面板,核心变量包括:数字经济指数(DigEcon_Index)、每万人人力资本(HumanCap_per10k)、区域创新指数(Innovation_Index)。
**执行要求**:
绝对不要写正文!只给我一份【骨架大纲】,精确到一级与二级标题。
要求:研究方法部分要体现面板数据的计量特征(固定效应、中介/调节效应、内生性处理),
标题动词前置、紧扣"数字经济—人力资本—创新"这条主线,不要写成放之四海皆准的空标题。📄 AI 真实生成的经管方案骨架(仅一、二级标题)—— 点击展开
# 数字经济发展对区域创新能力的影响——基于30省10年面板数据
## 国家自然科学基金·研究方案骨架
一、问题提出:数字经济为何未能等比例转化为创新产出
1.1 现实背景——东中西部数字鸿沟与创新落差并存
1.2 文献述评:直接效应充分、传导机制研究的三处空白
1.3 研究的理论与政策意义
二、理论框架与研究假设
2.1 核心机制:数字经济通过人力资本积累驱动创新
2.2 调节情境:要素市场化程度的边界条件
2.3 待检验的三组研究假设(H1 直接效应 / H2 中介 / H3 调节)
三、研究设计与计量模型
3.1 数据来源与变量测度(DigEcon_Index / HumanCap_per10k / Innovation_Index)
3.2 基准回归:双向固定效应面板模型
3.3 机制检验:人力资本的中介效应分解
3.4 内生性与稳健性:工具变量、滞后项与安慰剂检验
四、预期成果、进度与研究基础
4.1 预期结论与政策建议形式
4.2 三年进度安排
4.3 团队前期积累与数据条件阶段二:只改一处(中文提示词)
假设你看完骨架,觉得 3.4 内生性处理只写了工具变量,不够。只点名改这一条:
骨架整体可用。但 3.4 内生性与稳健性这一条偏单薄,只提了工具变量。
请只针对 3.4 这一个二级条目,补充 3 种与省级面板更匹配的内生性/稳健性处理思路
(例如系统GMM、Bartik工具变量、双重差分的政策冲击识别),其余大纲一律保持不变。阶段三:只填一节(中文提示词 + 预期输出)
骨架敲定后,指名填 3.2 基准回归这一节,给足约束:
大纲已确定。请只为【3.2 基准回归:双向固定效应面板模型】写约 300 字的方法描述。
要求:写清被解释变量、核心解释变量、控制变量与双向固定效应的设定逻辑;
涉及具体数值(系数、显著性、样本量)的地方,请用占位符标注"待回归后回填",不要编造。📝 AI 预期填充的「3.2」方法段(约 280 字)+ 黄区标注 —— 点击展开
读法同上:🟢 绿区=方法表述稳妥、可保留;🟡 黄区=待回归后回填的数值占位,绝不能让 AI 替你编。
本研究以区域创新指数(
Innovation_Index)为被解释变量,以数字经济指数(DigEcon_Index)为核心解释变量,构建双向固定效应面板模型。🟢 模型同时控制省份固定效应与年份固定效应,以吸收不随时间变化的地区禀赋差异与共同的宏观冲击。🟢 控制变量纳入每万人人力资本(HumanCap_per10k)等可能同时影响数字经济与创新的因素,以缓解遗漏变量偏误。🟢 样本为 30 个省级单位、10 个年度,共 300 个观测(🟡 实际有效观测数须按数据清洗结果回填)。🟢 预期核心解释变量系数显著为正(🟡 具体系数与显著性水平待回归后回填,不在此预设),表明数字经济发展对区域创新具有正向驱动作用。🟢
怎么用这段:
| 片段 | 判定 | 处置动作 |
|---|---|---|
| 双向固定效应的设定逻辑、控制变量动机 | 🟢 绿区 | 直接保留,按刊物格式微调 |
| "300 个观测" | 🟡 黄区 | 数据清洗后回填真实有效观测数 |
| "系数显著为正" | 🟡 黄区 | 跑完回归再写,附系数与 p 值;切勿先验下结论 |
Innovation_Index / DigEcon_Index / HumanCap_per10k | 🟢 绿区 | 与 Case B 数据字典一致,可沿用 |
📌 迁移要点:理工/医学的研究计划也照此办理——只把骨架里的"计量模型"换成"实验设计/技术路线",填肉时引用的换成你自己的样本与指标即可。漏斗不变,换的只是学科词汇。
🚧 方法的边界与局限
"骨架与填充"是个好用的脚手架,但它不是万能的,也不能替你承担学术责任。把它的适用边界讲清楚,才不会用错地方:
- 它擅长"结构与措辞",不擅长"判断与真伪"。 漏斗能帮你快速搭出逻辑清晰的骨架、把每节写通顺;但研究问题值不值得做、理论框架对不对、方法选得是否合理,这些核心学术判断仍须由你来下。AI 给的骨架是"看起来专业的草稿",不是"经过论证的方案"。
- 黄区内容是硬约束,不是建议。 凡 AI 填出来的具体数字、系数、样本量、文献出处、人名、年份,一律默认不可信(幻觉风险),必须回原始数据集或原文核对后才能用。本节示例中的"500 名""r ≈ −.26""300 个观测""系数显著为正"全部属于黄区——核对的责任始终在你,且不能靠"再追问 AI 一次"来确认(它会把错的也说得很顺)。
- 骨架越"前沿",越要警惕被带偏。 阶段二让 AI 头脑风暴"更新颖的方法"(如脑电/眼动、系统 GMM、Bartik 工具变量)时,它倾向于给出听起来高级、但未必与你的数据条件匹配的建议。新方法是否真的可行、数据是否支持,需你独立核验,别因为"它说得很专业"就照单全收。
- 学科红线不可逾越。 涉及人类被试的研究(如 Case A 的中小学生心理问卷),知情同意、伦理审查、未成年人数据保护等不能由 AI 代为"补全"成既成事实;把"已通过伦理审查"之类未发生的事写进申报书,属于学术不端。AI 写出的伦理/合规表述同样按黄区核对。
- 它会迎合你的预设。 若你在提示里暗示了想要的结论(如"证明数字经济促进创新"),模型往往会顺着写出支持性论证。真正的研究要容得下"假设不成立"的结果——所以本节示例特意要求"系数显著性待回归后回填、不在此预设"。
- 什么时候这套方法收益有限:内容本身极短(一两句话)、或你心里已有完整成稿只差润色时,分步反而啰嗦——直接写、直接改即可。漏斗的价值在"长、空、无从下笔"的场景,不必处处套用。
⚠️ 本节常见误区速查
“先骨架后填充”看着简单,真上手时学员最常踩下面这几个坑。对照纠正即可:
| 常见误区 | 后果 | 纠正方法 |
|---|---|---|
| 跳过大纲,直接让 AI 生成长篇正文 | 得到"假大空"排比,整篇只能推倒重来 | 先只要一、二级标题骨架,确认逻辑后再填肉 |
| 骨架敲定后一句话填整篇 | 各章详略失衡、相互重复,AI 顾此失彼 | 一次只填一节,指明截面、字数与语气 |
| 章节失衡:背景写满、方法/结果空泛 | 评审看出重点错位,方法不可复现 | 填肉前先给每章分配字数预算,方法/结果优先写实 |
| 放任 AI 自填样本量、系数、文献 | 引入虚构数据与假引用,学术风险高 | 数字/出处一律留占位,事后回数据集与原文核对(黄区原则) |
| 骨架不满意就整份重写 | 浪费已确认的好结构,反复横跳 | 只对单个二级条目定向修订,其余冻结不动 |
输出仍不满意?怎么迭代
走完三阶段,首版仍可能不够好。先判断是哪一环出了问题,再针对性回炉,不要笼统地说"再改改":
- 骨架就跑偏(章节逻辑不对)→ 别急着填肉。回到阶段二,点名某个二级标题做定向修订,骨架不动其余部分。
- 某一节填得空(正文像口号)→ 用第 2 课的负向纠偏法:明确告诉它"不要写成排比/不要堆形容词",并补上你要的具体证据或变量,让它重写这一节。
- 详略失衡(某章过长/过短)→ 给出字数预算重填,例如"这一节压到 300 字,只保留方法设定,删去背景铺垫"。
- 数字/引用存疑(黄区内容)→ 不靠追问 AI 来"确认",而是回原始数据集或文献核对——AI 会把假的也说得很顺。
🔁 迭代心法:每一轮只改一个明确的小问题,与漏斗"缩小靶面"的逻辑一致。漫无目标地让它"整体优化",往往越改越平庸。
📦 本课交付物
按本节实操任务完成并提交以下内容(提交 AI 初审),按 Module_Rubrics.md 对应维度评分:
- [ ] 本节实操产出:本节任务区块要求的具体文件 / 文本 / 截图
- [ ] AI 协作日志:至少 1 段完整的"任务描述 → AI 输出 → 人工修正"对话记录
- [ ] 四维质检记录:用
Course_QA_Checklists.md(事实/逻辑/格式/引用)核查本节 AI 输出的笔记 - [ ] 沉淀模板:将本课关键 Prompt / 流程 / 检查清单加入你的个人工具箱
🏁 本章小结
本节的核心,是用增量写作(先骨架、后填充)这一思路,把"面对空白文档无从下笔、又怕一次性长文假大空"的难题拆成可控的小步。要点凝练如下:
- 一句话的方法:长且专业的内容,先骨架、再局部、后逐节填肉,而非一次性索取全文。三步分别管"绝不写正文 / 只改一处 / 只填一节"。
- 为什么有效:大模型是按概率"预测下一个词",靶面越大、约束越少,它越倾向于回退到训练语料里的万能空话;把任务切小、给足约束,等于把它的预测牢牢框住,也把结构判断的关口留给了人。
- 黄区原则(贯穿全程):AI 擅长把话写顺,但没有可信事实库、会产生幻觉;凡具体数字、系数、出处、伦理合规表述,一律留占位、事后回原始数据集/原文核对——不能靠追问 AI 来"确认"。
- 迁移性:漏斗与学科无关。社科课题(Case A)、经管方案(Case B)、理工技术路线共用同一套流程,换的只是骨架词汇与填肉时引用的数据。
- 边界感:方法管"结构与措辞",不管"判断与真伪";内容极短或已有成稿时不必套用;学科红线(知情同意、伦理审查、未成年人数据)不可由 AI 代为"补全"成既成事实。
- 迭代方法:首版不佳时,先定位是"骨架跑偏 / 某节写空 / 详略失衡 / 数字存疑"中的哪一类,再针对单点回炉,避免笼统地"整体优化"。
✅ 自测清单
- [ ] 我已经改掉了“请用全自动一键帮我写完”的依赖习惯。
- [ ] 我掌握了先确定大纲、再修改二级目录、最后逐节“填充”的写作方法。
- [ ] 我能说清"先骨架后填充"为什么更可控(结合大模型"预测下一个词"的行为)。
- [ ] 我能指出一段 AI 填充正文里哪些是绿区、哪些是必须核对的黄区。
- [ ] 我在今天的实操中发现,AI 生成目录大纲的能力,明显强于直接生成长篇空泛文章。
📝 思考与练习
下面 4 题用于把本节概念真正用起来(区别于交付物,重在理解与判断)。建议动手写出答案再对照"好答案要点"。
练习 1 · 识别黄区。 下面是 AI 为 Case A 填出的一句正文:
"本研究回收有效问卷 500 份,分析显示焦虑(
Anxiety_Mean)与自我效能(Efficacy_Mean)显著负相关(r = −.26, p < .001),且学习策略(Strategy_Mean)起部分中介作用。"
请逐项标出哪些是绿区(可保留)、哪些是黄区(须核对),并写明每处黄区的核对动作。
好答案要点
变量名 Anxiety_Mean/Efficacy_Mean/Strategy_Mean 与 Case A 数据字典一致 → 绿区。"500 份"样本量、"r = −.26"、"p < .001"、"部分中介作用"这一带显著性的结论全部是黄区:样本量回收口径核对,相关系数与 p 值回 Case A 实跑相关/中介分析复核,中介结论须在跑出 Bootstrap 区间后才能下,不能先写。关键是认识到"显著性与方向性结论"也属黄区,不只是数字。
练习 2 · 写一条合格的阶段一提示词。 针对 Case C(300 条文本 × 3 个模型评分,列 Quality_GPT5/Quality_Claude47/Quality_Gemini25,1–5 分、3 名标注者)的一份《大模型生成质量人工评估方案》,写一条只要骨架的中文提示词。
好答案要点
应满足三点:① 显式"绝不要正文、只给一、二级标题"(负向提示);② 给身份与真实数据背景(300×3、三名标注者、1–5 分量表);③ 标题要求动词/判断前置、绑定本题(如评分者一致性 Kappa/ICC、三模型两两比较),而非"研究背景/研究意义"这类万能词。能体现"靶面收窄"的意识即为合格。
练习 3 · 把"重写"改成"改一处"。 学员看完 Case B 骨架后说:"3.3 机制检验这块不行,整份重写。" 请把这句改写成符合本节原则的定向修订指令,并说明为什么这样更省时间。
好答案要点
改写示例:"骨架整体保留,只针对 3.3 这一个二级条目,把中介效应分解补充为 Bootstrap 中介 + 分组回归两种思路,其余大纲一律不动。" 说明应扣住:整份重写会丢掉已确认的好结构、且让 AI 重新发挥更易引入新空话;锁定单点等于"缩小靶面",与漏斗逻辑一致——这正是分步省时间的来源。
练习 4 · 解释一个"为什么"。 用大模型"按概率预测下一个词、没有接入可信事实库"这两条确凿事实,向一位同事解释:为什么"先骨架后填充"得到的开头,比"一口气 8000 字"更不容易写出空话?(限 150 字内)
好答案要点
好答案应只用本节给的两条事实、不编造内部机制:靶面大、约束少时,模型倾向回退到训练语料里高频且安全的万能表达(即空话);把任务切小、给足约束后,预测被框定,更难滑回空话。可补一句:但无论哪种,具体数字仍因"无事实库"而须核对。避免出现"注意力锚定""算力"等臆造术语即合格。
