多模型多视角下AI生成与学者撰写文献内容的比较研究

图书馆杂志 ›› 2026, Vol. 45 ›› Issue (5): 37-47.

多模型多视角下AI生成与学者撰写文献内容的比较研究

张强，高颖，辛竹琳，任豆豆，周洪

出版日期:2026-05-15 发布日期:2026-05-27
作者简介:张强淮阴师范学院文学院，讲师；南京农业大学人文与社会发展学院，博士后。研究方向：科技情报、数字人文。作者贡献：提出研究思路、论文撰写。E-mail： zhangqiang_dh@163.com 江苏淮安 223300
高颖南京农业大学人文与社会发展学院，博士研究生。研究方向：科技情报、数字人文。作者贡献：论文撰写与修改。江苏南京 210095
辛竹琳中国科学院大学武汉文献情报中心，博士研究生。研究方向：科技情报。作者贡献：论文撰写与修改。湖北武汉 430071
任豆豆新疆大学计算机科学与技术学院，硕士研究生。研究方向：深度学习、自然语言处理。作者贡献：进行实验。新疆乌鲁木齐 830017
周洪中国科学院大学武汉文献情报中心，副研究员。研究方向：科技情报。作者贡献：设计研究方案、论文修改。湖北武汉 430071

A Comparative Study of AI-Generated and Scholar-Written Academic Literature from Multiple Models and Perspectives

Zhang Qiang, Gao Ying, Xin Zhulin, Ren Doudou, Zhou Hong

Online:2026-05-15 Published:2026-05-27
About author:Zhang Qiang, Gao Ying, Xin Zhulin, Ren Doudou, Zhou Hong

摘要/Abstract

摘要： 本研究通过对比分析AI生成与学者撰写的档案学期刊文献内容，深入探讨了AI技术在学术写作中的应用潜力及其相较于学者创作的相对优势与局限性。研究选取了近3年档案学领域核心期刊中的100篇高被引论文，提取其摘要、引言和结论部分，并利用6种大语言模型生成相应摘要。通过语义相似度、主题模型、分类检测、ROUGE评测及学术出版检测等多个维度进行系统分析。研究结果表明，6种模型生成的摘要与学者撰写的摘要具有高度相似性，其中通义千问在主题提炼方面表现尤为突出，其生成内容更贴近学者的专业深度。在分类检测方面，随机森林（RF）与Xgboost模型展现出优异的性能。ROUGE评测结果显示，大模型生成的摘要质量已达到甚至超越传统算法水平，文心一言4.0在此项评测中表现尤为显著。在学术查重测试中，GPT4.0与通义千问均符合规范，尤其是通义千问在知网AIGC检测中表现出极低的疑似AI生成比例。基于上述发现，本研究建议学术出版平台在学术不端检测方面需进一步适应新型文本生成技术的发展，细化AIGC检测标准，加强跨平台合作与数据共享，并特别关注通义千问模型带来的检测挑战。

关键词: 大语言模型, AIGC检测, 学术写作, 文本评测

Abstract: This study compares and analyzes the content of archival journal articles generated by AI with those written by scholars, delving into the potential of AI technology in academic writing and its relative advantages and limitations compared to human-authored works. The research selected 100 highly cited papers from core journals in the field of archival studies over the past three years. The abstracts, introductions, and conclusions were extracted, and corresponding abstracts were generated using six large language models. A systematic analysis was conducted across multiple dimensions, including semantic similarity, topic modeling, classification detection, ROUGE evaluation, and academic publication detection. The results indicate that the abstracts generated by the six models exhibit a high degree of similarity to those written by scholars, with Tongyi Qianwen particularly excelling in topic refinement, producing content that closely aligns with the professional depth of scholars. In terms of classification detection, the Random Forest (RF) and XGBoost models demonstrated outstanding performance. ROUGE evaluation results show that the quality of abstracts generated by large models has reached or even surpassed traditional algorithm levels, with Wenxin Yiyan 4.0 performing especially well. In academic plagiarism detection tests, both GPT4.0 and Tongyi Qianwen met the standards. Tongyi Qianwen shows an extremely low proportion of suspected AI-generated content in the CNKI AIGC detection. Based on these findings, this study recommends that academic publishing platforms further adapt to the development of new text generation technologies, refine AIGC detection standards, enhance crossplatform collaboration and data sharing, and pay special attention to the detection challenges posed by the Tongyi Qianwen model.

Key words: Large language model, AIGC detection, Academic writing, Text evaluation

张强, 高颖, 辛竹琳, 任豆豆, 周洪. 多模型多视角下AI生成与学者撰写文献内容的比较研究[J]. 图书馆杂志, 2026, 45(5): 37-47.

Zhang Qiang, Gao Ying, Xin Zhulin, Ren Doudou, Zhou Hong. A Comparative Study of AI-Generated and Scholar-Written Academic Literature from Multiple Models and Perspectives[J]. Libraly Journal, 2026, 45(5): 37-47.

参考文献

［1］王静静, 叶鹰, 王婉茹. GPT类技术应用开启智能信息处理之颠覆性变革[J]. 图书馆杂志,2023, 42（5）： 9-13.
［2］ Wu Tianyu, He Shizhu, Liu Jingping, et al. A brief overview of ChatGPT： the history, status quo and potential future development[J]. IEEE/CAA Journal of Automatica Sinica, 2023, 10（5）： 1122-1136.
［3］令小雄，王鼎民,袁健.ChatGPT爆火后关于科技伦理及学术伦理的冷思考[J].新疆师范大学学报（哲学社会科学版）,2023, 44（4）： 123-136.
［4］ Liao Wenxiong, Liu Zhengliang, Dai Haixing, et al. Differentiating ChatGPT-generated and human-written medical texts： quantitative study[J]. JMIR Medical Education, 2023, 9（1）： e48904.
［5］王鹏涛, 徐润婕. AIGC介入知识生产下学术出版信任机制的重构研究[J]. 图书情报知识,2023, 40（5）： 110.
［6］金家琴,刘炜.AI2.0时代的数字学术及其范式变革[J].图书馆杂志,2023, 42（11）： 1021.
［7］高奇琦.GPT技术与人文社会科学知识生产：智能时代的学者与学术研究[J].上海交通大学学报（哲学社会科学版）,2023, 31（6）： 111122.
［8］王树义,张庆薇.ChatGPT给科研工作者带来的机遇与挑战[J].图书馆论坛,2023, 43（3）：109118.
［9］ Ashish Vaswani, Noam Shazeer, Niki Parmar, et al. Attention is all you need[C]//Advances in Neural Information Processing Systems： Curran Associates, Inc., 2017，30.
[10] Tom Brown, Benjamin Mann, Nick Ryder, et al. Language models are fewshot learners[C]//Advances in Neural Information Processing Systems： Curran Associates, Inc., 2020， 33：18771901.
[11] 钱力,刘熠,张智雄,等.ChatGPT的技术基础分析[J].数据分析与知识发现,2023, 7（3）： 615.
[12] 张伟男,刘挺.ChatGPT技术解析及通用人工智能发展展望[J].中国科学基金,2023, 37（5）： 751757.
[13] 李宝,杨哲,唐明珍.ChatGPT对教育的冲击、风险及应对策略[J].高教探索,2024（1）： 2328.
[14] 侯跃伟.生成式人工智能生成内容的法律属性及刑法保护[J].江西社会科学,2024, 44（8）： 101112.
[15] 李扬,刘云丹.类ChatGPT技术对新闻生产与传播的影响及伦理考量[J].传媒,2024（3）： 3133.
[16] 郑泉.生成式人工智能的知识生产与传播范式变革及应对[J].自然辩证法研究,2024, 40（3）： 7482.
[17] 刘琼,刘桂锋,卢章平,等.谋求与突破：ChatGPT对信息资源管理学科的影响与启示[J].信息资源管理学报,2023, 13（5）： 7378.
[18] 张强,高颖,赵逸淳,等.ChatGPT在智慧图书馆建设中的机遇与挑战[J].图书馆理论与实践,2023（6）： 116122.
[19] 曹树金,曹茹烨.从ChatGPT看生成式AI对情报学研究与实践的影响[J].现代情报,2023, 43（4）：310.
[20] 陈艳红,李健.新一代人工智能生成内容档案身份的认定风险及规制研究——基于对ChatGPT生成内容的思考[J].档案学研究,2023（5）： 412.
[21] Li Bo, Fang Gexiang, Yang Yang, et al. Evaluating ChatGPT's information extraction capabilities： an assessment of performance, explainability, calibration, and faithfulness[PP/OL]. ARXiv（2023-04-23）[2024-12-06]. https://arxiv.org/abs/2304.11633.
[22] Ahmed M Elkhatat. Evaluating the authenticity of ChatGPT responses： a study on text-matching capabilities[J]. International Journal for Educational Integrity, 2023, 19（1）： 123.
[23] 张华平,李林翰,李春锦.ChatGPT中文性能测评与风险应对[J].数据分析与知识发现,2023, 7（3）： 1625.
[24] 陈隽柏,吴国平,张童,等.语言学视角下人工智能生成内容与用户生成内容的对比研究——以在线医疗服务场景为例[J].情报理论与实践,2024, 47（9）： 113.
[25] 郭鑫,王一博,王继民.ChatGPT生成中文学术内容分析——以情报学领域为例[J].图书馆论坛,2024, 44（3）： 134143.
[26] Denys Dinkevych. CRISPE—prompt engineering framework[EB/OL]. [2024-12-06]. https：//sourcingdenis.medium.com/crispe-prompt-engineering-framework-e47eaaf83611.

[1]	崔宇红, 赵锦涛, 张欢. 基于生成式人工智能的学术搜索平台评价研究[J]. 图书馆杂志, 2026, 45(5): 27-36.
[2]	周正达, 王昊, 汪琳, 李晓敏, 周抒, 姚天辰. ChatKG：一种基于大语言模型和提示工程的非遗知识图谱构建框架[J]. 图书馆杂志, 2026, 45(4): 82-97.
[3]	戴晴宜, 韩春磊, 高智晨. 基于大模型的文献数据库服务创新探索与研究——以《全国报刊索引》数据库智能检索服务为例[J]. 图书馆杂志, 2026, 45(4): 71-81.
[4]	范炜. 技术赋能下图书情报的知识组织研究[J]. 图书馆杂志, 2026, 45(2): 33-40.
[5]	富国瑞　王平利　王一展　宋西贵(山东大学图书馆). 基于大语言模型的高校图书馆智能参考咨询服务构建与应用研究——以山东大学图书馆为例[J]. 图书馆杂志, 2025, 44(416): 31-40.
[6]	王希羽1, 2 　王东波1, 2 (1 南京农业大学信息管理学院　2 南京农业大学人文与社会计算研究中心). 基于大语言模型的跨语言典籍自动分词研究 [J]. 图书馆杂志, 2025, 44(413): 104-115.
[7]	胡蝶1, 2 林立涛3 刘浏1, 2 沈思4 王东波1, 2 （1 南京农业大学信息管理学院 2 南京农业大学人文与社会计算研究中心 3 南京大学信息管理学院 4 南京理工大学经济管理学院）. 基于大语言模型的人文社会科学学术论文学科分类研究[J]. 图书馆杂志, 2025, 44(408): 110-122.
[8]	唐振贵1 罗锦坤2 胡蓉3 （1 广西财经学院新闻与文化传播学院 2 莆田学院新工科产业学院 3 西南大学教师教育学院）. 星空记忆：中国古代天象记录智慧数据构建框架研究[J]. 图书馆杂志, 2025, 44(408): 70-83.
[9]	刘江峰1, 2 张冉1, 2 张君冬2 裴雷1, 2 （1 南京大学数据智能与交叉创新实验室 2 南京大学信息管理学院）. 以生成式人工智能赋能思想史计算研究：模型构建与应用探索 [J]. 图书馆杂志, 2025, 44(407): 113-127.
[10]	孙翌刘音（上海交通大学图书馆）. 基于知识图谱和大语言模型的口述历史资源的问答应用研究[J]. 图书馆杂志, 2025, 44(405): 98-107.
[11]	傅爱雯邵波（南京大学信息管理学院南京大学图书馆）. 基于大语言模型的文献资源保障体系运行机制的重构研究[J]. 图书馆杂志, 2024, 43(402): 60-69.
[12]	李谦升（上海大学上海美术学院）. 数智时代美术资源知识服务体系构建研究——以艺术类院校应用场景为例[J]. 图书馆杂志, 2024, 43(401): 24-36.
[13]	韩春磊姚啸华张宏玲刘英捷沈立力（上海图书馆）. 新时代古籍智慧化服务实践探讨——以古典小说续作研究场景为例[J]. 图书馆杂志, 2023, 42(392): 58-68.
[14]	沈立力张宏玲韩春磊姚啸华张文棋（上海图书馆）. 图书馆数字人文工具建设实践与未来展望[J]. 图书馆杂志, 2023, 42(392): 45-57.
[15]	刘倩倩刘圣婴刘炜（上海图书馆华东师范大学图书馆）. 图书情报领域大模型的应用模式和数据治理[J]. 图书馆杂志, 2023, 42(392): 22-35.