点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享

科学家们在科研工作中准备完成文献综述时,常常会有这样的体验:检索与下载文献和资料耗去了大半时间,真正坐到电脑前,反倒迟迟下不了笔。这里的问题通常不出在文字功夫上,而是心里少了一张“地图”——哪些文献该进综述、它们之间是承接还是分歧、关键术语口径是否一致、写下的结论能不能与所引文献一一对上。
如今,一家以光量子芯片闻名的科技公司试图帮研究者补上这张地图。
近日,北京中科国光量子科技有限公司(以下简称“国光量子”)推出科研文献搜集与综述撰写复合应用,把“检索—整理—撰稿—校订”拆解为一套可执行、可检查的分步流程,并在界面上实时呈现整体进度,让用户随时看到自己处于哪个阶段、已经沉淀下哪些中间结果。
文献综述写不动,AI为何又帮不上忙
一篇综述能不能立得住,关键在于“证据池”够不够扎实,比如覆盖面是否充分、噪声是否可控、重要分支是否被遗漏。然而同一主题在不同文献中的表述往往并不一致,仅靠几个关键词,容易陷入两难的局面:结果过多则筛选成本居高不下,策略过窄则容易错过代表性工作。
解决证据池的难题只是第一步,综述必须交代清楚文献之间的关系:技术脉络、方法差异、实验条件与结论的对应、不同结论背后可能依赖的模型假设。缺少结构化的阅读笔记与术语对照,写作便反复停顿——不是找不到词,而是不敢落笔,科研工作者很难快速确认自己的表述是否与所依据的文献相符。
大语言模型的出现让许多研究者看到希望。直接让AI来解释摘要、改写句式、生成提纲草案,确实省下了可观时间。但若把目标定为“一次对话直接产出可提交的综述”,事情就没那么简单了。
通用大模型在缺乏明确约束时,往往弱化甚至省略检索与筛选过程,使读者难以判断结论基于哪些文献、遵循了怎样的取舍标准。更棘手的是所谓“幻觉”(hallucination)现象——虚构不存在的论文或作者,张冠李戴不同文献的结论,给出看似具体却无法溯源的数据。这类问题在短文本问答中并不显眼,一旦放进综述这种长文本、强引用的场景,人工核对的成本便陡然上升。其本质并非“故意造假”,而是概率性语言生成在缺少外部约束与核验机制时的系统性风险。
分阶段、可追溯、可校订:把长流程切开
国光量子的解法,是将综述写作的长流程切分为顺序推进的步骤,每一阶段都有明确产出,并保留可回溯的中间材料。在交互层面,用户可随时看到进度变化与各阶段的结果摘要,而非只在终点收到一份长文。
针对AI幻觉风险,这套流程并不宣称“模型从此不再出错”,而是借助工程化手段,把生成内容尽可能约束在可追溯的证据链之内:先固定文献集合与分篇提要,再让模型在既定材料上组织语言,把“可能编造”的空间压缩为“在已给出的来源范围内进行重述与归纳”,并在校订环节对关键事实与术语一致性进行二次核对。换言之,缓解幻觉的关键在于降低数据不可核验的自由度,而非用一次长回答把不确定性掩盖过去。
具体而言,三个阶段各有侧重。
检索阶段:分步建立文献集合——先覆盖近期相关工作以把握前沿,再按相关性补充代表作,最后沿参考文献链向外扩展补齐经典与分支,使文献集合的形成过程更透明、更可解释。
整理阶段:先完成结构化材料,再进入大段撰写。系统引导生成分组聚类、引用关系概览、分篇提要、术语与实体对照、主题时间线等中间结果,帮助作者在动笔前对齐概念口径、明确事实来源,避免凭印象写作带来的表述不一致。
撰稿与校订阶段:初稿是可修订版本而非终稿。生成初稿后,系统仍保留审查环节,核对术语与模型假设的前后一致性,并对有限规模与渐近结论的区别、实验条件与理论模型的对应关系等易忽略的边界条件给出修改提示。
此外,这套应用的对话区域与文献管理区域彼此协同,免去了用户在多个窗口之间频繁切换的注意力损耗。
不过,国光量子也明确指出:目前虽然已经针对包括QKD在内的量子科技相关文献实现了比较成熟的智能整理过程,能够完整展示从检索到综述初稿的完整链路,但其实际意义在于通过一个特定的科研场景来呈现文献资料组织方法与交互形态,并不等同于“对任意学术领域都能在不加配置的情况下达到同等深度”的自动化承诺。
工具的作用是降低重复性劳动与组织成本,而非替代学术判断,是否采纳某篇文献、如何评价结论的可靠性、综述最终采取何种立场,仍须由具备专业背景的研究者亲自决定。(肖春芳)
