定制报告-个性化定制-按需专项定制研究报告
行业报告、薪酬报告
联系:400-6363-638

《中国科学技术信息研究所:2024学术出版中AIGC使用边界指南2.0(11页).pdf》由会员分享,可在线阅读,更多相关《中国科学技术信息研究所:2024学术出版中AIGC使用边界指南2.0(11页).pdf(11页珍藏版)》请在薪酬报告网上搜索。
1、使用边界指南2.0Guideline on the Boundaries ofAIGC Usage in Academic Publishing 2.0学术出版中中国科学技术信息研究所爱思唯尔、施普林格自然、约翰威立国际出版集团泰勒-弗朗西斯出版集团、威科集团、剑桥大学出版社(排名不分先后)中国科学技术信息研究所科学计量与评价研究中心北京市海淀区复兴路15号邮编:100038电话:+86-10 58882604联系人:郑雯雯邮箱:目录1 背景.012 目标.022.1 防范学术不端,加强科研诚信治理.022.2 引导相关利益主体就AIGC使用达成共识.023 原则.023.1 透明度和问责制.
2、023.2 隐私和安全.023.3 公平.023.4 可持续发展.034 行为框架/实践指导.034.1 研究开展和论文撰写阶段.034.1.1 资料收集.034.1.2 统计分析.044.1.3 图表制作.044.1.4 文字撰写.044.1.5 语言和润色.054.1.6 引文整理.054.2 投稿阶段.054.2.1 作者署名.054.2.2 规范引用.054.2.3 披露和声明.064.2.4 同行评审.064.3 论文发表/出版后5.1 案例1:作者将道德和诚信问题归咎于ChatGPT5.2 案例2:某医疗团队论文撤稿事件.064.3.1 数据仓储和共享.064.3.2 AIGC相关
3、材料提交、存档.064.3.3 AIGC产生内容的检测和发现.065 案例分析.076 总结.07.07.077 致谢.08近年来,随着人工智能技术的迅速发展,特别是2022年11月人工智能聊天机器人ChatGPT的发布,人工智能内容生成(Artificial Intelligence Generated Content,简称AIGC)已经走进公众视野,并被广泛利用。人们清楚地认识到人工智能(AI)正在获得产生流利语言的能力,产生的大量语句越来越难与人写的文本区分开来。一些科学家已经在使用聊天机器人作为研究助手,帮助其组织思维,对他们的工作产生反馈,协助其编写代码并总结研究文献。AI在研究论文
4、写作、创作等方面的影响不断增强,但是对学术研究的透明性、完整性产生重要影响,引起学术界的广泛关注。学术界最担忧的是科学家、研究人员、学生等可能会欺骗性地将AIGC生成的文本作为自己的文本,或者简单使用AIGC并产生不可靠的研究成果。LLMs(Large Language Models)通过学习大量在线文本数据库中的语言统计模式来工作,很容易产生错误和误导性信息,且可能无法显示其信息的来源。如果没有输出控制,AIGC很容易被用来产生不当言论或不可靠的研究结果,影响科研生态环境。同时,根据现有检测方法,使用AIGC还可能增加学术不端检测的难度(例如背景1学术出版中AIGC使用边界指南2.0背景01
5、抄袭和图像操纵检测)。因此,如何使用AIGC,设定界限并提供可参考的指南至关重要。目前,一些国家科技管理机构、出版领域、期刊等针对AI技术在学术论文中的使用进行了研讨,并提供了一些相关的准则、指南等,例如国际出版伦理道德委员会(COPE),国际医学期刊编辑委员会(ICMJE),国际科学、技术和医学出版商协会(STM),Taylor&Francis,Wiley,Springer Nature,Elsevier,Wolters Kluwer等。值得注意的是,不同机构在不同时期发布的AI相关指南和规范性文件,有着不同的表述和要求,例如用于临床试验的CONSORT-AI;用于临床试验方案的 SPIRI
6、T-AI;用于预测模型的TRIPOD+AI等。为此,在广泛调研和梳理现有业内相关研究和探索工作的基础上,我们致力于为AI技术在学术出版中的最佳行为实践提供一个基本原则的框架和指南,希望能够引导出版界、科学界和科技管理部门就AI技术使用规范进一步形成共识。因为AI是一项新兴技术,技术的性质及如何使用将不可避免地发生变化,我们将根据情况变化,持续、及时更新这份指南。目录1 背景.012 目标.022.1 防范学术不端,加强科研诚信治理.022.2 引导相关利益主体就AIGC使用达成共识.023 原则.023.1 透明度和问责制.023.2 隐私和安全.023.3 公平.023.4 可持续发展.03
7、4 行为框架/实践指导.034.1 研究开展和论文撰写阶段.034.1.1 资料收集.034.1.2 统计分析.044.1.3 图表制作.044.1.4 文字撰写.044.1.5 语言和润色.054.1.6 引文整理.054.2 投稿阶段.054.2.1 作者署名.054.2.2 规范引用.054.2.3 披露和声明.064.2.4 同行评审.064.3 论文发表/出版后5.1 案例1:作者将道德和诚信问题归咎于ChatGPT5.2 案例2:某医疗团队论文撤稿事件.064.3.1 数据仓储和共享.064.3.2 AIGC相关材料提交、存档.064.3.3 AIGC产生内容的检测和发现.065
8、案例分析.076 总结.07.07.077 致谢.08近年来,随着人工智能技术的迅速发展,特别是2022年11月人工智能聊天机器人ChatGPT的发布,人工智能内容生成(Artificial Intelligence Generated Content,简称AIGC)已经走进公众视野,并被广泛利用。人们清楚地认识到人工智能(AI)正在获得产生流利语言的能力,产生的大量语句越来越难与人写的文本区分开来。一些科学家已经在使用聊天机器人作为研究助手,帮助其组织思维,对他们的工作产生反馈,协助其编写代码并总结研究文献。AI在研究论文写作、创作等方面的影响不断增强,但是对学术研究的透明性、完整性产生重要
9、影响,引起学术界的广泛关注。学术界最担忧的是科学家、研究人员、学生等可能会欺骗性地将AIGC生成的文本作为自己的文本,或者简单使用AIGC并产生不可靠的研究成果。LLMs(Large Language Models)通过学习大量在线文本数据库中的语言统计模式来工作,很容易产生错误和误导性信息,且可能无法显示其信息的来源。如果没有输出控制,AIGC很容易被用来产生不当言论或不可靠的研究结果,影响科研生态环境。同时,根据现有检测方法,使用AIGC还可能增加学术不端检测的难度(例如背景1学术出版中AIGC使用边界指南2.0背景01抄袭和图像操纵检测)。因此,如何使用AIGC,设定界限并提供可参考的指
10、南至关重要。目前,一些国家科技管理机构、出版领域、期刊等针对AI技术在学术论文中的使用进行了研讨,并提供了一些相关的准则、指南等,例如国际出版伦理道德委员会(COPE),国际医学期刊编辑委员会(ICMJE),国际科学、技术和医学出版商协会(STM),Taylor&Francis,Wiley,Springer Nature,Elsevier,Wolters Kluwer等。值得注意的是,不同机构在不同时期发布的AI相关指南和规范性文件,有着不同的表述和要求,例如用于临床试验的CONSORT-AI;用于临床试验方案的 SPIRIT-AI;用于预测模型的TRIPOD+AI等。为此,在广泛调研和梳理现
11、有业内相关研究和探索工作的基础上,我们致力于为AI技术在学术出版中的最佳行为实践提供一个基本原则的框架和指南,希望能够引导出版界、科学界和科技管理部门就AI技术使用规范进一步形成共识。因为AI是一项新兴技术,技术的性质及如何使用将不可避免地发生变化,我们将根据情况变化,持续、及时更新这份指南。02032.1 防范学术不端,加强科研诚信治理以防范AIGC不当使用作为切入点,加强科研诚信意识教育,推进学术诚信治理,推进科研活动合法有序开展。2.2 引导相关利益主体就AIGC使用达成共识明晰相关利益主体在学术期刊论文准备、研究和数据收集、写作、投稿、评审、出版、传播各环节应该履行的最佳行为实践,提供
12、详尽、规范的AIGC使用指导。目标23.1 透明度和问责制透明度和问责制是学术出版中AIGC使用最基本的原则。在学术研究到出版发行的过程中,所有应用功能使用者(包括研究人员、作者、同行评议人和读者)都应该了解并明确披露AIGC在其工作中的使用情况,应用程序提供者、技术开发者应该明确披露说明该应用程序接受过的数据训练、内容来源。透明度应该包括数据透明度(包括底层数据集、数据来源和数据处理方法),以及知识产权和版权材料的使用情况。问责制则是关键利益相关者应共同承担的责任,包括研究人员、研究机构、资助者、政策制定者和出版商,应建立问责标准和相关信息。确保质量和诚信是在学术研究中AIGC应用建立信任的
13、基础。从算法的设计和构建,到用于训练AIGC的输入,再到实际应用中使用的输入,应坚持问责和透明原则,并通过标识符或反馈等手段表明AIGC的使用,保证学术研究的质量和诚信不受AIGC技术使用的影响。3.4 可持续发展AI系统的多学科性质使其非常适合解决全球关注的领域,如联合国可持续发展目标、碳中和等。它还为公共和私营组织提供了提高效率的机会,以实现更大的生态可持续性和责任。尽管AI系统承载着造福全人类,包括子孙后代的承诺,但我们也必须认识到训练和使用生成式AI的能源密集型性质,这对环境的影响不容忽视。为高质量输入数据的供应商提供资金和其他奖励措施,4.1 研究开展和论文撰写阶段本部分以指导性建议
14、为主,对研究人员投稿前的研究开展和论文撰写阶段使用AIGC提出建议。4.1.1 资料收集AIGC所提供的资料是基于大数据和大语言模型生成和抽取的,其准确性和真实性缺乏考量和验证,需要研究人员确认内容的可靠性。文献调研:可以借助AIGC收集关键词或主题相关已发表的参考文献,并进行分类和梳理,总结参考文献结论,为研究人员提供参考;帮助研究人员发现新的信息来源,并跟踪研究领域最新进展。需要注意的是,由于AIGC提供的参考文献可能是虚构或过时的,使用AIGC支持其文献综述的研究人员必须阅读并验证AIGC提供的每项建议和参考文献的真实性,并做出人为主导4.1.2 统计分析某些情况下,研究人员已经收集了数
15、据,但不确定用何种最佳的统计分析来验证其假设。研究人员可使用AIGC来选择最合适的分析方法或进行统计分析,但所用的数据必须是研究人员进行实验并收集的或其他合理方式获得的,并且研究人员需要对AIGC所提供的统计分析结果进行验证,确保统计结果的可靠性和有效性。数据分析和解释:研究人员可以借助AIGC解释数据,计算统计学指标,进行一些简单的数据分析和统计3.2 隐私和安全隐私和安全是AIGC使用的基本法律原则。在使用AIGC时应尊重隐私和数据保护,包括数据、隐私和安全影响评估,并通过适当的数据匿名来保护隐私,开展数据保护和安全措施来确保数据安全。作者还应遵守其所投稿的出版机构的特定隐私和保密政策。此
16、外,使用大语言模型的用户应意识到,任何提交的信息可能会被抓取并用于训练模型,因此应采取必要的措施来保护敏感数据。3.3 公平使用AIGC时应秉持公平原则,避免偏见。由于人工智能具有复制和放大偏差的风险,因此在训练数据选择、算法设计、模型生成和优化、使用过程中,应仔细评估和审查潜在的偏差来源,并建立反馈机制,监测和审查可能的不公平现象,及时纠偏。同时,AIGC能够帮助提供诸如语言润色等服务,减少此类文化或语言上的不公平现象。原则3AIGC可在研究开展及学术出版的各个阶段提供辅助作用(服务)。为了营造良好的科研氛围,防患于未然,避免/减少不当使用AIGC行为的发生,本部分提供一个行为框架,以帮助作
17、者、研究机构、学术出版单位等就如何合规合理地使用AIGC做出指导。行为框架/实践指导4学术出版中AIGC使用边界指南2.0目标丨原则学术出版中AIGC使用边界指南2.0原则丨行为框架/实践指导如出版商创建的出版物和数据库,有助于提取重要的可采取行动的知识。可持续发展应是AIGC本身的核心原则。为减少重复和浪费,使用AIGC应避免过度依赖可能暂时或永久不可用的数据,同时工具的功能模块应基于公认标准和指南,以确保数据可查找、可访问、可互操作和可重复使用。在这一过程中,应特别注意减少生成式AI对环境的影响,推动可持续的技术发展。的决策,确定在研究中应包含哪些内容。概念解答:AIGC可以回答一些简单的
18、概念问题,为研究人员在构建章节内容时提供帮助。但要注意,AIGC是基于语料库提供的概念解答,因此对任何 AIGC 的人工监督都是必不可少的步骤。观点类资料调研:AIGC可以采集文本中公众或专家对某些主题的观点、情感及情感倾向的相关数据资料。研究人员必须监督和控制AIGC提供的观点资料,对AIGC提供的资料进行清洗处理,以确保研究人员使用的资料是有效、无偏的,防止传播不正确、有偏见或歧视性的信息。02032.1 防范学术不端,加强科研诚信治理以防范AIGC不当使用作为切入点,加强科研诚信意识教育,推进学术诚信治理,推进科研活动合法有序开展。2.2 引导相关利益主体就AIGC使用达成共识明晰相关利
19、益主体在学术期刊论文准备、研究和数据收集、写作、投稿、评审、出版、传播各环节应该履行的最佳行为实践,提供详尽、规范的AIGC使用指导。目标23.1 透明度和问责制透明度和问责制是学术出版中AIGC使用最基本的原则。在学术研究到出版发行的过程中,所有应用功能使用者(包括研究人员、作者、同行评议人和读者)都应该了解并明确披露AIGC在其工作中的使用情况,应用程序提供者、技术开发者应该明确披露说明该应用程序接受过的数据训练、内容来源。透明度应该包括数据透明度(包括底层数据集、数据来源和数据处理方法),以及知识产权和版权材料的使用情况。问责制则是关键利益相关者应共同承担的责任,包括研究人员、研究机构、
20、资助者、政策制定者和出版商,应建立问责标准和相关信息。确保质量和诚信是在学术研究中AIGC应用建立信任的基础。从算法的设计和构建,到用于训练AIGC的输入,再到实际应用中使用的输入,应坚持问责和透明原则,并通过标识符或反馈等手段表明AIGC的使用,保证学术研究的质量和诚信不受AIGC技术使用的影响。3.4 可持续发展AI系统的多学科性质使其非常适合解决全球关注的领域,如联合国可持续发展目标、碳中和等。它还为公共和私营组织提供了提高效率的机会,以实现更大的生态可持续性和责任。尽管AI系统承载着造福全人类,包括子孙后代的承诺,但我们也必须认识到训练和使用生成式AI的能源密集型性质,这对环境的影响不
21、容忽视。为高质量输入数据的供应商提供资金和其他奖励措施,4.1 研究开展和论文撰写阶段本部分以指导性建议为主,对研究人员投稿前的研究开展和论文撰写阶段使用AIGC提出建议。4.1.1 资料收集AIGC所提供的资料是基于大数据和大语言模型生成和抽取的,其准确性和真实性缺乏考量和验证,需要研究人员确认内容的可靠性。文献调研:可以借助AIGC收集关键词或主题相关已发表的参考文献,并进行分类和梳理,总结参考文献结论,为研究人员提供参考;帮助研究人员发现新的信息来源,并跟踪研究领域最新进展。需要注意的是,由于AIGC提供的参考文献可能是虚构或过时的,使用AIGC支持其文献综述的研究人员必须阅读并验证AI
22、GC提供的每项建议和参考文献的真实性,并做出人为主导4.1.2 统计分析某些情况下,研究人员已经收集了数据,但不确定用何种最佳的统计分析来验证其假设。研究人员可使用AIGC来选择最合适的分析方法或进行统计分析,但所用的数据必须是研究人员进行实验并收集的或其他合理方式获得的,并且研究人员需要对AIGC所提供的统计分析结果进行验证,确保统计结果的可靠性和有效性。数据分析和解释:研究人员可以借助AIGC解释数据,计算统计学指标,进行一些简单的数据分析和统计3.2 隐私和安全隐私和安全是AIGC使用的基本法律原则。在使用AIGC时应尊重隐私和数据保护,包括数据、隐私和安全影响评估,并通过适当的数据匿名
23、来保护隐私,开展数据保护和安全措施来确保数据安全。作者还应遵守其所投稿的出版机构的特定隐私和保密政策。此外,使用大语言模型的用户应意识到,任何提交的信息可能会被抓取并用于训练模型,因此应采取必要的措施来保护敏感数据。3.3 公平使用AIGC时应秉持公平原则,避免偏见。由于人工智能具有复制和放大偏差的风险,因此在训练数据选择、算法设计、模型生成和优化、使用过程中,应仔细评估和审查潜在的偏差来源,并建立反馈机制,监测和审查可能的不公平现象,及时纠偏。同时,AIGC能够帮助提供诸如语言润色等服务,减少此类文化或语言上的不公平现象。原则3AIGC可在研究开展及学术出版的各个阶段提供辅助作用(服务)。为
24、了营造良好的科研氛围,防患于未然,避免/减少不当使用AIGC行为的发生,本部分提供一个行为框架,以帮助作者、研究机构、学术出版单位等就如何合规合理地使用AIGC做出指导。行为框架/实践指导4学术出版中AIGC使用边界指南2.0目标丨原则学术出版中AIGC使用边界指南2.0原则丨行为框架/实践指导如出版商创建的出版物和数据库,有助于提取重要的可采取行动的知识。可持续发展应是AIGC本身的核心原则。为减少重复和浪费,使用AIGC应避免过度依赖可能暂时或永久不可用的数据,同时工具的功能模块应基于公认标准和指南,以确保数据可查找、可访问、可互操作和可重复使用。在这一过程中,应特别注意减少生成式AI对环
25、境的影响,推动可持续的技术发展。的决策,确定在研究中应包含哪些内容。概念解答:AIGC可以回答一些简单的概念问题,为研究人员在构建章节内容时提供帮助。但要注意,AIGC是基于语料库提供的概念解答,因此对任何 AIGC 的人工监督都是必不可少的步骤。观点类资料调研:AIGC可以采集文本中公众或专家对某些主题的观点、情感及情感倾向的相关数据资料。研究人员必须监督和控制AIGC提供的观点资料,对AIGC提供的资料进行清洗处理,以确保研究人员使用的资料是有效、无偏的,防止传播不正确、有偏见或歧视性的信息。04054.1.4 文字撰写在论文撰写过程中,AIGC可用于提高文本可读性、启发内容逻辑性、提供句
26、式等,也可用于在研究过程中总结其他学术出版物或生成文献综述部分,以供研4.1.5 语言和润色学术语言服务:语言不应该成为学术交流与科学传播的障碍。AIGC可以作为高标准语言检查器,提高稿件可读性和写作质量,以消除研究传播中的语言障碍。目前,AIGC的学术语言服务可以帮助非英语母语的研究人员润色稿件使其符合国际期刊的投稿要求。但研究人员也需注意,当手稿(全部或部分)输入到公共或数据安全和保密标准较低的私人AIGC工具中时,有可能成为大型语言模型训练语料库的一部分。在使用手稿(或部分内容)用于此目的的人工智能工具之前,应该与共同作者和其他利益相关者(如资助者或出版商)预先达成一致的意见。4.1.6
27、 引文整理当涉及AIGC推荐的任何内容时,“引用相关性”至关重要。研究人员需确保引用的内容与论文切实相关,包括引文和被引内容的真实性。引文格式检查:AIGC可以检查引用的文献是否符合学术论文的引文格式,并指出可能存在的错误或缺陷。自动引用生成:作者有责任确保任何AI工具生成的引文是可靠、准确和相关的。尽管AIGC可以帮助研究人员确定引用来源,并根据作者提供的文献信息,自动生成符合学术论文引文格式要求的引文,但它应仅作为辅助工具。作者必须对引文负责,并仔细核对引用文献的格式和内容,以确保引用符合学术论文的规范要求。参考文献自动排序:AIGC可以按照指定的引文格式自动对参考文献列表进行排序和顺序校
28、对,在学术写作中帮助作者完成规范引用的相关任务,减少人工操作的繁琐,提高论文的质量和研究人员的效率。4.2 投稿阶段AIGC可以在投稿阶段提供帮助,但这需要研究人员的专业判断,并承担最终的责任。4.2.1 作者署名在没有人工监督和指导的情况下,研究人员不应该让 AIGC 工具独立发起、进行或制作研究成果,AIGC 工具也不能对已发表的作品或研究设计负责。同样,它在绝大多数国家也没有法律地位或持有或转让版权的能力,而这些责任和能力是对作者身份的基本要求。因此,根据COPE对人工智能工具的立场声明,AIGC不能履行文章作者的角色,也不能被列为文章作者。4.2.2 规范引用所有来自其他来源的内容必须
29、经过仔细确认、恰当引用标注。研究人员对于AIGC所提供的资料需要验证其真实性和准确性,并对其底层数据来源、工具、获取方式、处理等进行引用标注。4.1.3 图表制作图表和图像生成:根据数据特点和作图目的,AIGC可以依据不同的运用场景,推荐合适的统计图表类型,直观呈现数据结论,有效地传递信息,从而节省研究人员制作图表的时间,提高写作效率。但蛋白质印迹实验图、细胞技术分析、组织细胞染色图等实验生成类图像必须由真实开展的实验研究获得,不可通过AIGC直接生成。也不允许在图形摘要等艺术作品的制作中使用AIGC 或 AI 辅助工具。在某些情况下,如果作者事先获得期刊编辑和出版商的许可,可以证明已获得使用
30、相关材料的所有必要权利,并确保内容归属正确,则可能允许在封面艺术的制作中使用AIGC。统计图表格式处理和优化:研究人员在处理和优化统计图表时,可以根据数据量和具体需求使用AIGC工具辅助调整图表样式。这些调整包括但不限于调整字体大小、添加或修改数据标注、添加图例、更改颜色等。这些优化措施旨在使图表更加清晰、美观,增强其可读性和易于理解性。同时,研究人员应确保在使用AIGC工具调整图表时,遵循规范操作,保证数据的真实性和准确性。图像格式处理和优化:本条目涵盖的视频和动画(包括视频静态图像)、摄影、科学图表、照片插图和其他拼贴画,以及编辑插图(如图画、卡通或其他二维或三维视觉觉表现形式)等图像类型
31、。增强、模糊、移动、删除或引入图像中的特定特征是不可接受的。然而,只要亮度、对比度或色彩平衡的调整不会模糊或消除原始图像中的任何信息,则可以接受这些调整。同样,也可以接受添加图例和图像标注等修正。研究人员结果的描述,但不能取代他们自己对数据的解释。统计方法的建议和指导:AIGC可以根据问题和领域知识,为研究人员提供统计分析建议和指导,但只是基于其所学习的语言模型和知识库,可能存在缺失和不准确。因此,研究人员需甄别AIGC所提供的统计分析建议的可行性,结合其他可靠统计分析和数据挖掘工具进行判断,或向专业的领域专家寻求指导和帮助,最终判断是否采纳AIGC提供的建议。在使用AIGC工具创建或更改图像
32、内容时,需对所进行的修改进行详细描述,包括如何使用人工智能或人工智能辅助工具的具体过程,并提供所使用工具的名称、版本号和制造商信息,以确保透明度和可追溯性。案例示范:AIGC在图表制作中的应用示例1:趋势分析场景:需要展示过去十年某项技术的发展趋势。AIGC应用:AIGC工具可以根据提供的数据生成折线图,自动调整图表的坐标轴、标注、图例等,以清晰展示趋势。示例2:分类数据分析场景:需要比较不同产品的市场份额。AIGC应用:AIGC工具可以根据分类数据生成柱状图或饼图,推荐最适合的数据展示形式,自动设置图表颜色和标签,以便于解读。示例3:学术报告图表美化场景:需要在学术报告中展示研究结果,但图表
33、样式不够美观。AIGC应用:可以使用AIGC工具调整图表的字体大小、颜色、数据标注和图例位置,使图表更加美观和易于理解。示例4:亮度和对比度调整场景:需要展示发掘现场的照片,但由于拍摄条件不佳,照片过于昏暗。AIGC应用:可以使用AIGC工具调整照片的亮度和对比度,使细节更加清晰,而不丢失原始信息。示例5:医学影像标注场景:需要在会议中展示患者的医学影像,并强调某些重要特征。AIGC应用:可以使用AIGC工具在影像上添加图例和标注,指出重要的解剖结构或病变部位,以便观众更好地理解图像内容。究人员参考撰写,但不应该用来产生研究假设、直接撰写整篇论文文本或解释数据、得出科学结论等。为避免AIGC总