人工智能与出版业的未来

编者按：8月15日，在2023 年第七届科技出版“走出去”研讨会暨上海交通大学出版社成立40周年活动上，励讯集团中国区高级副总裁张玉国发表了以《AI时代，内容为王：人工智能与出版业》为主题的演讲。张玉国认为，在人工智能时代，高质量、可信任的数据（内容），对用户需求的深刻理解，先进的技术与平台，负责任的AI使用原则，将是专业出版机构致胜的关键。

人工智能与出版业的未来

◎ 张玉国励讯集团中国区高级副总裁

生成式AI（generative AI）技术的面世对内容创作和信息获取的逻辑带来了颠覆式的变革，同时也引发了媒体的多轮热议。在新的AI时代，传统出版行业怎样才能赢得未来？

什么是AI？AI本质上是一种机器智能或软件，其主要功能包括搜索引擎、推荐系统、理解人类语言、自动驾驶汽车、生成或创意工具、棋类等战略游戏。如果按照这个定义，励讯集团的4个业务板块都在应用AI。

励讯集团与AI

在处理文本数据场景下，在生成式AI变为热门话题之前，广泛应用的人工智能技术主要是提取式AI（extractive AI），最典型的应用就是搜索、推荐、预测。励讯集团旗下的科研信息分析公司爱思唯尔，以及法律信息服务商律商联讯，其产品就广泛使用提取式AI技术，从大量文本（科研论文、学术期刊、法律法规和案例等）中提取关键的知识点和洞察，为专业人士提供解决方案。

生成式AI技术在2017~2018年前后出现，励讯集团一直密切关注。今年5月，励讯集团旗下法律业务板块律商联讯就推出了Lexis + AI，科技和医学板块爱思唯尔也在今年8月推出了Scopus AI。

生成式AI在法律行业有巨大的商业机会。今年3月，律商联讯针对近5000名法律从业人员做了一个调研，调研结果显示，84%的被访者认为生成式AI工具将显著提高律师、律师助理或法律文员的效率，应用领域主要在问题研究、起草文件、精简工作和文件分析等方面。

那么，AI会不会取代律师？不会。参与调研的一名律师说的一句话特别好：“AI不会取代律师，但使用AI的律师将会取代不使用AI的律师。”

机遇与挑战并存

生成式AI技术潜力巨大，但也带来了很多挑战，比如幻觉（hallucination）、事实错误、偏见、数据安全和隐私保护、知识产权保护、虚假信息等。“AI教父”辛顿甚至认为，大语言模型可能会对人类的生存构成威胁。我想主要谈谈AI对专业出版领域有哪些影响。

比如说AI的幻觉问题。生成式AI会生成完全捏造的信息，既不准确也不真实，也就是普通人所说的“一本正经的胡说八道”。《纽约时报》今年5月27日报道，某律师在法庭诉讼中引用了若干司法案例，该律师在前期文书准备工作当中使用了Chat GPT，但遗憾的是，其中7个案例都是Chat GPT虚构的，在真实生活当中并不存在。这位律师不但输掉了官司，连今后能否继续执业都成了问题。特别有趣的是，这位律师在使用时还特意问了Chat GPT，能否保证列举的案例的真实性，他得到的回答是“是的”。在科研领域也发生过类似问题，生成式AI编造了并不存在的科学引文文献。

幻觉问题产生的根本原因之一，是训练数据的不完整、不准确、有偏见。在开放的互联网环境下训练大语言模型（LLM），这一问题很难避免，互联网上充斥着错误和有偏见的信息。但是，对科技和医学、法律等专业人士来说，“差不多”（good enough）就够了吗？

励讯集团的内容优势

励讯集团也在应用AI，但与大众使用的生成式AI产品的不同之处，就在于其背后依靠的独特的内容优势。

励讯集团在其4个业务领域积累了海量的数据和内容，而且都是高质量、完整、可信赖的。比如在科技和医学领域，期刊论文要经过同行评审，且有专业人员进行审核校准，其质量是互联网上庞杂的内容所无法比拟的。值得一提的是，这些数据和内容是我们经过几百年历史积累下来的，比如励讯集团旗下医学类旗舰期刊《柳叶刀》（The Lancet）成立于1823年，今年是其创刊200周年。200年栉风沐雨，几代出版人和医学工作者共同打造，这样的内容怎么可能不可信？

技术变迁与出版业发展

从印刷术发明以来，出版业最擅长的一件事就是策划、编辑、出版高质量和可信赖的内容。过去300年技术不断变化：电报、电话、广播、电视、互联网，从未让出版业消亡，人工智能也不会。

过去这么多年以来，并不是所有热议的技术概念都形成了大规模的商业应用。专业人士判断，生成式AI将来也许会成为市场可普遍获得的一项技术，就像云计算一样，花钱就可以购买使用这项服务。

对于专业出版机构来说，AI时代还是内容为王。高质量、可信任的内容，对用户需求的深刻理解，先进的技术和平台，负责任的AI使用原则，将是专业出版的致胜关键。这也是励讯集团20年坚持不变的战略。