加入收藏 | 设为首页 | 会员中心 | 我要投稿 云计算网_宿迁站长网 (https://www.0527zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 移动互联 > 应用 > 正文

机器人写作:AI 应用的技术反思(上)

发布时间:2022-12-03 11:02:25 所属栏目:应用 来源:未知
导读: 文|李红秀
作者简介:李红秀,重庆交通大学人文学院教授,巴渝学者特聘教授,文学博士。
【摘 要】在大数据时代,人工智能(Artificial Intelligence,简称“AI”)技术正在成为社会生存的

文|李红秀

作者简介:李红秀,重庆交通大学人文学院教授,巴渝学者特聘教授,文学博士。

【摘 要】在大数据时代,人工智能(Artificial Intelligence,简称“AI”)技术正在成为社会生存的基础,机器人写作在新闻界的应用越来越广泛。文章研究机器人写作的发展现状和AI技术中的自然语言生成(Natural Language Generation,简称“NLG”)系统原理,探讨机器人写作与记者写作之间的关系, 分析机器人生成新闻的可信度问题,指出社会物理学时代机器人写作面临的困境,进而指出,对AI 技术的应用要持理性态度,对机器人写作的使用要有一定的限度。

【关键词】机器人写作;AI技术;记者写作;可信度

伴随着计算机科学的快速发展, 基于人工智能(Artificial Intelligence,简称“AI”)技术的各种机器人不断被研发出来, 机器人在社会生活中的使用越来越广泛。目前,机器人主要用于救灾、军事、工业、医学、教育等领域,比如搜索机器人、太空机器人、排毒机器人、手术机器人、学习机器人等。不仅如此,机器人还可以像人一样写作,而将写作机器人运用到新闻领域,在新闻界引起了轩然大波。

机器人写作最早出现在美国。2006 年,美国汤姆森公司开始使用机器人撰写经济和金融方面的新闻稿件。2007 年, 美国科技公司Automated Insights 开发了一款名叫“Word-Smith”的软件。这款软件可以自行编写一些简单事件的新闻,比如体育、财经类的新闻,雅虎、美联社的相当一部分新闻就是由WordSmith 编写的。《纽约时报》《华盛顿邮报》《洛杉矶时报》《卫报》近年来都已经将机器人写作不同程度地用于新闻采编的多个环节。在中国,2015 年9月10 日,“腾讯财经” 开发了写稿机器人“Dreamwriter”;同年11 月,新华社迎来一位新“同事”———机器人“快笔小新”。2017年1月17 日,南方都市报推出的南都机器人“小南”,一秒钟就完成了春运稿件的写作。2017 年4月24 日, 据新华社报道, 全球首个机器人记者———中国智能机器人“佳佳”诞生,并越洋采访了美国著名科技观察家凯文·凯利。

对新闻从业者而言,“狼来了”不是谎言,机器人写作对新闻业的冲击是显而易见的,但是,机器人写作对新闻业的发展是福还是祸, 目前还无法估量。本文思考的问题是:机器人写作的基本规律是什么, 机器人写作是否会取代人类写作,机器人写作是否真的完美无缺,在机器人写作时代人类记者有何存在的价值。

一、机器人写作的发展

与AI 技术原理

目前, 学界对机器人写作进行现象描述和介绍的很多,对机器人写作进行定义的却很少。机器人写作在新闻领域应用比较频繁, 因此大多数学者热衷于研究机器人新闻写作。最先对机器人新闻写作进行研究的是美国学者佐伯芙(Shoshana Zuboff)。她在1981年发表的《计算机成为工作替代者》一文中这样描述:“不难想象,人类的记者在不久的将来将被软件取代。事实上, 这种转变已经存在, 编辑已由软件编辑替换。电脑编程故事将由机器人记者完成。数字化如何影响记者?多技能记者今后的处境怎样?他们将如何应对即将到来的令人不安的状况? 什么是机器人新闻?为什么要使用算法新闻学?机器人生成什么样的文本? 算法新闻会取代人类记者吗?自动文本要考虑哪些伦理问题?……这些都需要作出回答。”佐伯芙对机器人写作在新闻领域的应用作了大胆预测和思考, 特别是提出了与机器人写作相关的概念,比如“机器人新闻”(Robot Journalism),“机器人记者”(Robot Journalist),“算法新闻学”(Algorithmic Journalism),“自动化新闻”(Automated Journalism)。不过,她并没有对这些概念进行解释和说明。

机器人写作是伴随着AI 技术的发展而发展的, 其核心是云计算和大数据(Big Data)分析, 即从庞杂的资讯中找出最可能受市场关注的那部分, 将算法生成的内容(Algorithmic Generated Content,简称“AGC”)用人们能够接受的格式呈现出来。整个过程是自动化的。这是计算机基于算法的数据分析和自我学习的技术,体现了AI 技术的“算法的中立性”(Neutrality of Algorithms)。这一中立性相当于新闻报道的客观性。

赖特(Reiter)指出:“‘机器人写作’又叫‘算法写作’(Algorithmic Writing),主要来源于自然语言生成(Natural Language Generation, 简称‘NLG’)技术领域,这是基于非语言输入(Nonlinguistic Input) 的自动生成文本的过程。” 通常,NLG 系统必须能够执行如下标准化的任务:首先,选择哪些信息来表达内容;其次,组织可用信息并确定结构文本, 确定哪些信息被放置在任何句子中都能够准确表达意思;最后,创建要显示的表达式,同时语句要符合语法规则。只有通过这样的系统设置, 机器人写出的文本才可能语法正确,表达清晰。

最初的NLG 系统只能生成非常简单且没有太多变化的文本。经过科学家多年的努力,计算机语言识别技术得到快速发展,NLG 系统已经能够生成各种各样的文本。

如今,AI 技术快速发展, 诞生了Yseop、CBS(Columbia Broadcasting System)互动媒体公司等各种AI 企业;同时,涌现了各种各样的机器人写作软件, 比如, 一款名为“幻想记者”(Fantasy Journalist) 的软件,“能写出非常深刻和比较人性化的文章, 这类文章很难分辨出是人写的还是机器写的”。

奥贝莱特(Ombelet)指出,完成机器人自动化写作一般需要四个参与者(Actors)———软件程序员(Software Programmer)、数据源(Data Source)、编辑(Editor)和出版者(Publisher),其作用各不相同。“软件程序员是为了开发内容的创造性算法, 数据源要确保能够为算法提供足够的原始数据, 编辑的工作是选择数据源和监督自动化进程, 出版者是为了给他们的读者发布所需要的内容”。当然,在机器人写作的具体实践中,软件程序员、编辑和出版者可以是同一个参与者。比如,2014 年3 月17 日,美国加州发生了一次4.7 级的地震,《洛杉矶时报》(Los Angeles Times)的记者施文克(Ken Schwencke)在地震发生3 分钟后, 利用“地震机器人”(Quakebot)撰写了一条新闻。

据美国地质调查局报道,星期一早上,加利福尼亚韦斯特伍德5 英里(8 公里)处发生了一次浅层4.7 级地震。地震发生在太平洋时间上午6:25,深度为5.0英里。美国地质调查局称, 震中距加利福尼亚州贝弗利山庄6英里,距环球城7 英里,距圣莫尼卡7英里,距萨克拉门托市348英里。在过去的10 天里,震中附近没有发生3.0 级以上的地震。这一信息来自美国地质勘探局地震通知服务, 这篇文章是由作者编写的一个算法创建的。

AI 技术就像人类一样能够“思考”,只要创建一个自动化识别算法的软件, 机器人就能根据用户的需要“写出”让用户感兴趣的个性化文本,比如谷歌、百度的网页排名和推特的趋势排名。以大数据为基础的机器人写作能够在几秒钟之内生成用户需要的文本,比如股票价格、体育统计、天气预报、财务报告等,能在短时间内满足用户的需要。

二、机器人写作

与记者写作

记者写作新闻依赖于一个基本公式:标题、导语、主体、背景,主要元素包括5W+1H,即谁(Who)、何时(When)、何地(Where)、何事(What)、何因(Why)、何果(How)。对于具体的新闻事件而言,首先是要寻找新闻故事,找到读者感兴趣的故事点, 对故事不能简单地平铺直叙;其次是要选择写作对象,这是新闻报道的核心,并且要写出生动的细节,这些细节还必须按正确的顺序排列, 从而达到结构化(Structured)的效果; 最后是根据现实中的故事一步步地展开写作。

随着机器人写作在新闻界越来越广泛的使用, 一些学者开始对机器人新闻写作进行概念上的界定。学者喻国明指出:“所谓机器新闻写作是一种自然语言生成引擎,利用算法程序,通过采集大量的各种题材及高质量的数据, 建立各种分类的庞大数据库,借助人工智能(AI)实现从数据到认识、见解和建议的提升和跨越,最后由机器自动生产新闻。” 申云则这样定义:“所谓机器新闻写作就是用编辑好的程序以及现有的新闻相关数据生成可视化的新闻,对新闻写作进行格局性改变。”这两个定义虽然有所不同机器人应用, 但两位学者都充分认识到机器人新闻写作的核心要素是大数据和AI 的应用, 并且AI 技术的渗透对于新闻传播生产方式和传播格局的改变是全方位、全过程的。

那么,随着机器人写作的到来,新闻界还需要人类记者吗?这在学术界引发了很大的争论。赖特认为,“这很大程度取决于经济利益, 是雇佣和培养一个记者便宜呢, 还是创造和维持一个机器软件便宜? 经济决策通常在很大程度上取决于生成文本的数量”。言下之意,机器人写作能否取代人类记者写作主要由市场决定,特别是传媒行业会从经济效率的角度进行权衡。瑞典学者克莱瓦尔(Clerwall)的观点比较明确,“机器人新闻可以说是免费资源,记者只需关注来自软件的信息是否合乎要求……如果仅仅是发现和获取低层次的信息资料, 那么计算机新闻(Computational Journalism)比记者的工作更有实用价值。人类记者应该更多地关注新闻的验证、解释和传播”。克莱瓦尔主张机器人写作和人类记者写作应该有不同的分工。

有些学者明确反对用机器人写作代替人类记者写作,认为机器人写作缺乏灵活性,不能为故事提供分析, 如果让机器人撰写非常规的故事,就很难写得准确生动。达伦(Dalen)指出:“机器人无法避免陈词滥调,缺乏创造性和幽默感,虽然有人可能不同意这种看法。” 达伦并不反对使用机器人写作, 认为机器人可以从事日常生活中一些简单化和自动化的写作, 但是深度报道只能依靠人类记者完成, 因为当前的NLG技术还无法达到要求。

(未完待续。本文注释及参考文献略)

(本文刊于《秘书》2018年第6期)

(编辑:云计算网_宿迁站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!