编者按:8月15日,在2023 年第七届科技出版“走出去”研讨会暨上海交通大学出版社成立40周年活动上,励讯集团中国区高级副总裁张玉国发表了以《AI时代,内容为王:人工智能与出版业》为主题的演讲。张玉国认为,在人工智能时代,高质量、可信任的数据(内容),对用户需求的深刻理解,先进的技术与平台,负责任的AI使用原则,将是专业出版机构致胜的关键。
人工智能与出版业的未来
◎ 张玉国 励讯集团中国区高级副总裁
生成式AI(generative AI)技术的面世对内容创作和信息获取的逻辑带来了颠覆式的变革,同时也引发了媒体的多轮热议。在新的AI时代,传统出版行业怎样才能赢得未来?
什么是AI?AI本质上是一种机器智能或软件,其主要功能包括搜索引擎、推荐系统、理解人类语言、自动驾驶汽车、生成或创意工具、棋类等战略游戏。如果按照这个定义,励讯集团的4个业务板块都在应用AI。
励讯集团与AI
在处理文本数据场景下,在生成式AI变为热门话题之前,广泛应用的人工智能技术主要是提取式AI(extractive AI),最典型的应用就是搜索、推荐、预测。励讯集团旗下的科研信息分析公司爱思唯尔,以及法律信息服务商律商联讯,其产品就广泛使用提取式AI技术,从大量文本(科研论文、学术期刊、法律法规和案例等)中提取关键的知识点和洞察,为专业人士提供解决方案。
生成式AI技术在2017~2018年前后出现,励讯集团一直密切关注。今年5月,励讯集团旗下法律业务板块律商联讯就推出了Lexis + AI,科技和医学板块爱思唯尔也在今年8月推出了Scopus AI。
生成式AI在法律行业有巨大的商业机会。今年3月,律商联讯针对近5000名法律从业人员做了一个调研,调研结果显示,84%的被访者认为生成式AI工具将显著提高律师、律师助理或法律文员的效率,应用领域主要在问题研究、起草文件、精简工作和文件分析等方面。
那么,AI会不会取代律师?不会。参与调研的一名律师说的一句话特别好:“AI不会取代律师,但使用AI的律师将会取代不使用AI的律师。”
机遇与挑战并存
生成式AI技术潜力巨大,但也带来了很多挑战,比如幻觉(hallucination)、事实错误、偏见、数据安全和隐私保护、知识产权保护、虚假信息等。“AI教父”辛顿甚至认为,大语言模型可能会对人类的生存构成威胁。我想主要谈谈AI对专业出版领域有哪些影响。
比如说AI的幻觉问题。生成式AI会生成完全捏造的信息,既不准确也不真实,也就是普通人所说的“一本正经的胡说八道”。《纽约时报》今年5月27日报道,某律师在法庭诉讼中引用了若干司法案例,该律师在前期文书准备工作当中使用了Chat GPT,但遗憾的是,其中7个案例都是Chat GPT虚构的,在真实生活当中并不存在。这位律师不但输掉了官司,连今后能否继续执业都成了问题。特别有趣的是,这位律师在使用时还特意问了Chat GPT,能否保证列举的案例的真实性,他得到的回答是“是的”。在科研领域也发生过类似问题,生成式AI编造了并不存在的科学引文文献。
幻觉问题产生的根本原因之一,是训练数据的不完整、不准确、有偏见。在开放的互联网环境下训练大语言模型(LLM),这一问题很难避免,互联网上充斥着错误和有偏见的信息。但是,对科技和医学、法律等专业人士来说,“差不多”(good enough)就够了吗?
励讯集团的内容优势
励讯集团也在应用AI,但与大众使用的生成式AI产品的不同之处,就在于其背后依靠的独特的内容优势。
励讯集团在其4个业务领域积累了海量的数据和内容,而且都是高质量、完整、可信赖的。比如在科技和医学领域,期刊论文要经过同行评审,且有专业人员进行审核校准,其质量是互联网上庞杂的内容所无法比拟的。值得一提的是,这些数据和内容是我们经过几百年历史积累下来的,比如励讯集团旗下医学类旗舰期刊《柳叶刀》(The Lancet)成立于1823年,今年是其创刊200周年。200年栉风沐雨,几代出版人和医学工作者共同打造,这样的内容怎么可能不可信?
技术变迁与出版业发展
从印刷术发明以来,出版业最擅长的一件事就是策划、编辑、出版高质量和可信赖的内容。过去300年技术不断变化:电报、电话、广播、电视、互联网,从未让出版业消亡,人工智能也不会。
过去这么多年以来,并不是所有热议的技术概念都形成了大规模的商业应用。专业人士判断,生成式AI将来也许会成为市场可普遍获得的一项技术,就像云计算一样,花钱就可以购买使用这项服务。
对于专业出版机构来说,AI时代还是内容为王。高质量、可信任的内容,对用户需求的深刻理解,先进的技术和平台,负责任的AI使用原则,将是专业出版的致胜关键。这也是励讯集团20年坚持不变的战略。