1、36传媒观察2023 年第 6 期 总第 474 期【作者简介】史安斌,清华大学新闻与传播学院教授、博士生导师,清华-伊斯雷尔爱泼斯坦对外传播研究中心主任刘勇亮,清华大学新闻与传播学院博士研究生从媒介融合到人机协同:AI 赋能新闻生产的历史、现状与愿景史安斌 刘勇亮(清华大学 新闻与传播学院,北京 100084)【摘 要】人工智能(AI)的广泛应用给新闻业带来了变革与挑战。本文通过对 9 位媒体机构新闻工作者的深度访谈及相关资料分析,回顾了 AI 赋能中西方媒体新闻生产的历史和现状,分析了 AI 技术给新闻生产在内容偏向、隐私版权、信息真实等方面带来的挑战,梳理了从媒介融合到人机协同的演进路径
2、。为了适应 AI 赋能新闻生产的愿景,我们应当处理好生产力与创造力的关系,重新界定新闻从业者的职业身份,积极开展面向公众的 AI 素养教育。【关键词】ChatGPT;AIGC;人工智能;新闻生产;媒介伦理【中图分类号】G206 【文献标识码】A 【文章编号】1672-3406(2023)06-0036-82022 年 11 月 30 日,由马斯克等人投资创立的 OpenAI 实验室的人工智能生成聊天机器人 ChatGPT(Generative Pre-trained Transformer)问世,该系统采用机器学习进行训练,进而实现人机交互。作为人工智能通用大模型的最新成果,ChatGPT 拥
3、有庞大的数据库和惊人的算力,能够自动生成多种类型的文本内容,一经推出便引起了全球的广泛关注。作为与人工智能技术进行深度融合的领域之一,新闻业对包括ChatGPT 在内的人工智能技术进行了大范围的讨论。在了解人工智能如何参与和影响新闻生产之前,我们首先需要给人工智能下一个精准的定义:人工智能是一个与计算机系统执行能力有关的思想和技术的集合,所执行的任务通常需要人类智慧才能完成。因此,即使是 ChatGPT 这样最前沿的 AI 产品,也依然需要人类的干预才能发生作用。今年 3 月,由马斯克领衔千名业界和学界人士联署公开信要求暂停“训练”AI 大模型,但此举却遭到比尔盖茨等另一些人士的抵制,后者强调
4、应将重点放在如何有效利用 AI 技术上。同样道理,一方面新技术带来的道德伦理和职业身份的挑战,让新闻从业者和公众感到担忧,但另一方面 AI 给新闻生产转型升级带来的机遇令人振奋。为进一步认识 AI 对新闻业的影响,本文将对 AI 赋能新闻生产的历史和现状进行梳理,厘清从媒介融合到人机协同的演进路径,并对 AI 赋能新闻生产的愿景、挑战及其应对提出媒体融合研究DOI:10.19480/ki.cmgc.2023.06.01437方向性的建议。一、历史:AI 赋能新闻生产的演进按照人工智能技术的发展阶段和其参与新闻生产的深入程度,可以将新闻业中的人工智能技术划分为三个阶段:辅助增强、初步自动化与自动
5、内容生成。在辅助增强阶段,人工智能技术主要是作为辅助工具参与到新闻生产的过程中,以提高特定环节的生产效率。例如翻译软件、语音转文字程序、错别字检查工具等,都是 AI 作为工具服务于新闻生产特定环节。这一阶段,主流新闻媒体机构通过与企业合作开发,推出了各类人工智能工具来服务新闻生产。例如,2018 年以来,路透社一直在使用一个名为 Lynx Insight 的内部项目,以帮助新闻记者分析数据、提出故事构想,甚至撰写一部分新闻内容。为进一步了解不同媒介体制之下新闻行业对 AI 辅助增强技术的应用,本研究对 9 位分别来自人民日报、新华社、中央广播电视总台、财新、彭博社等媒体机构的新闻工作者进行了深
6、度访谈,同时对照伦敦政治经济学院教授贝克特(Charlie Beckett)撰写的题为新权力、新责任:新闻业和人工智能全球调查的报告,探讨中外新闻业对 AI 技术的应用情况。根据新闻生产的流程和人工智能的技术特点,本研究对新闻生产中的 AI 辅助增强功能进行了如下类型学的分析,梳理出中西方新闻媒体参与者相同与不同的关注点(如表 1 所示)。表 1 新闻生产中的人工智能技术运用可以看出,中西方新闻媒体机构都已经广泛引入 AI 服务于新闻生产的主要环节,并存在着相似的 AI技术使用场景,但在某些具体环节上也存在着使用的差异。从新闻采集来看,AI 主要被运用在信息收集、舆情研判、数据分析等新闻生产的
7、前期准备工作之中。相比之下,西方媒体更加注重 AI 的信息搜集能力,中国的主流媒体则更加注重 AI 的舆情监测功能。从新闻写作来看,人工智能技术可以帮助进行文本、图像、视频等内容的生成。在这一方面,西方媒体训练出大量自动新闻写作模型,并将其广泛投入到新闻实践之中。从新闻分发来看,人工智能技术在个性化推送层面拥有显著优势,中外媒体在这一层面都充分发挥了 AI 的技术优越性。除了在特定的环节提供辅助增强功能之外,人工智能还逐渐发展出机器新闻写作的能力。在这一阶段,人工智能技术超越了对特定环节的辅助增强功能,逐渐能够实现独立的新闻文本生成。早在 2014 年,美联社便开始与 Automated In
8、sights 合作开发新闻机器人 Wordsmith 来进行自动化新闻写作,每周可以生成数百万篇文章。在国内,腾讯的 Dreamwriter、今日头条的 xiaomingbot、百度的Writing-bots 和第一财经的 DT 稿王等,都是早期自动新闻写作机器人的代表。值得注意的是,这一阶段的机器新闻写作有一定的局限性,只能进行特定类型文本内容自动生成,例如体育报道、财经报道、气生产环节新闻采集新闻写作新闻分发媒体类型中国媒体西方媒体中国媒体西方媒体中国媒体西方媒体机器学习舆情监测,热点追踪排除虚假信息,收集主题相关资料训练新闻写作模型学习用户的偏好和舆情的走向自动生产自动抓取信息,为新闻写
9、作提供素材自动抓取数据、自动寻找采访对象语 音 转 文 字、AI语音生成等自动生成文本、图像、视频等内容自动推送用户感兴趣的新闻数据处理过滤重复信息从大数据中抓取有用数据大数据运算等对数据进行加工,用于预测趋势、舆情研判等计算用户偏好,服务于精准推送从媒介融合到人机协同:AI 赋能新闻生产的历史、现状与愿景媒体融合研究38传 媒 观 察象地质报道和健康领域报道等。ChatGPT 的出现,标志着人工智能已经进入到人工智能自动生成内容(AIGC)的新阶段。机器人记者可以通过机器学习和深度学习算法,从海量的数据和信息中提取新闻价值,并自动生成高质量、独立的新闻报道和分析文章。自 ChatGPT 问世
10、以来,多家传统媒体和新媒体相继推出了使用生成式 AI 的计划。新闻网站“嗡嗡喂”(BuzzFeed)宣布将使用 ChatGPT 为其著名的性格测验提供支持。纽约时报使用 ChatGPT 创建了一个情人节消息生成器。英国每日镜报和每日快报出版商 Reach 表示,该公司成立了专门工作组研究如何利用 ChatGPT 辅助新闻写作,例如撰写交通和天气预报等新闻文体。此外,美联社、路透社、华盛顿邮报、英国广播公司、泰晤士报等主流媒体均开始使用 ChatGPT 等 AI 工具来制作内容,提供个性化产品并以此提高受众的参与度。国内互联网企业百度开发的“文心一言”也宣布接入新京报、澎湃新闻、广州日报、中国妇
11、女报等媒体,开始与新闻媒体进行深入的合作。随着 AI 的发展和普及,其在新闻生产中的应用也将带来生产成本的降低和生产力的提升。例如,机器人记者可以通过自动化和智能化的方式,大幅度降低人力和物力成本,从而减轻新闻机构的财务压力和经营风险。此外,通过自动化和智能化的方式,人工智能技术可以解放出更多编辑和记者的生产力,从而生产更高质量、更有价值的新闻内容。二、现状:AI 赋能新闻生产的三大挑战2023 年 3 月,全球首个 AI 生成新闻平台 NewsGPT 问世。该平台通过收集来自社交媒体、新闻网站和政府机构等广泛的信息来源来生成新闻,号称“没有记者,也没有偏见,旨在为世界各地的读者提供公正的、基
12、于事实的新闻”。虽然人工智能的发展和进步使得新闻生产的数量和质量都得到了显著提升,但是我们也需要正视在人工智能深度介入新闻生产的当下,新闻业所面临的内容生产局限与挑战,即人工智能给新闻行业所带来的“信息危机”。(一)内容的平庸与偏向首先,自动生成的内容往往存在着浅表的问题。尽管人工智能技术在生成文本方面已经取得了很大进步,但是其生成的内容往往只是针对事件的客观描述,并不能像人类记者那样深入挖掘新闻事件的内部和背景,也不具备独特的洞见和视角,是“一本正经的胡说八道”。一方面,人工智能生成的内容通常缺乏一手信源和原创内容,这也是新闻报道的核心竞争力。由于无法直接接触到新闻事件现场或者与相关人员进行
13、面对面交流,人工智能在报道时难以获得真实的现场信息和细节,导致其生产的内容多是泛泛而谈,缺少细节的补充。另一方面,人工智能只能基于互联网上已有的信息进行文本撰写,这就代表着其输出的内容势必不是一手信息和原创内容,信息增量难以保证,新闻的价值也会因此大打折扣。此外,由于人工智能技术自身的限制,其在生成文本时可能会存在一定的偏向性,进而影响到新闻的客观性和公正性。例如,近期火爆的 Dall-E、Stable Diffusion 等人工智能图像生成模型放大了人口刻板印象,尤其反映在性别歧视、文化偏见等方面。当提示创建“清洁人员”图像时,这些人工智能图像生成模型生成的所有图像都是女性,但如果要求其生成
14、“工程师”时,所有的生成图像则都是男性。(二)数据的隐私与版权AI 赋能新闻生产还面临技术对数据所有权和隐私信息的挑战。大语言模型通过前期输入大量的内容来进行机器学习和训练,而这些输入的信息往往没有经过数据所有平台或者用户个人的许可。大量用户的个人信息在用户或平台不知情的前提下,被 ChatGPT 等大语言模型收集到语料库中进行媒体融合研究39机器学习,违反了欧洲通用信息保护(GDPR)等隐私数据保护法例。意大利因此已经禁止在境内使用 ChatGPT,英国、爱尔兰等欧洲国家也启动了针对 ChatGPT 数据隐私问题的调查。此外,AI 也往往在数据和信息版权方面存在争议。诞生不到半年的时间,Ch
15、atGPT 已经陷入与多家内容平台的纠纷之中。科技新闻网站 CNET 使用 ChatGPT 撰写了多篇文章,不仅被指出内容存在多处错误,且被发现这些文章剽窃了其他受保护的信息来源。社交平台“红迪网”(Reddit)也宣布,将向微软、谷歌、OpenAI 等公司收取数据使用费,因为这些企业都通过其应用程序编程接口(API),使用 Reddit 的平台内容来训练 AI 聊天机器人。(三)信息的真实与造假虽然人工智能可以从互联网上抓取大量的信息,但是其中的真实性和可信度却难以保证,这就容易引发新闻报道的误解或者失实。同时,人工智能自动生成内容的另一重大风险多模态虚假信息的生成,也给新闻真实带来了更加复
16、杂和难以识别的挑战。1.虚假的文本信息人工智能自动生成内容模型的出现,使得虚假信息的生成更加迅速且更具迷惑性。他们可以在短时间内生成大量虚假信息,并借由网络渠道广泛传播。此外,他们还会模仿人类的风格来润色内容,使得生产出的内容更加逼真,以致公众难以辨别真伪和来源。ChatGPT 会捏造事实,并编造出虚假的信息来源。美国加利福尼亚州的一位律师要求人工智能聊天机器人 ChatGPT 生成一份曾进行过性骚扰的法律学者名单,该程序则输出了一则关于乔治华盛顿大学某教授的性骚扰信息,还援引了华盛顿邮报2018 年 3 月的一篇文章作为信息来源。但事实上,该教授从未被指控过性骚扰,AI 所援引的华盛顿邮报报道更是不存在。当记者向由 GPT-4(ChatGPT 背后的引擎)提供支持的微软“必应”(Bing)提出同样的问题时,它则再次编造了针对该教授的虚假报道,并引用了他在 今日美国上发表的一篇专栏文章。与此类似,ChatGPT 最近捏造了澳大利亚的一名政客因贿赂入狱的消息,该政客因此要起诉 OpenAI 诽谤,这也将是全球首例针对人工智能机器人的诉讼案件。人工智能之所以会生成虚假信息,一个重要原因是其