当前位置: 首页 > 科技 > 人工智能 > 你看到的文字,可能是机器人写的_腾讯新闻

你看到的文字,可能是机器人写的_腾讯新闻

天乐
2020-07-06 12:42:08 第一视角

关注并将「人人都是产品经理」设为星标

每天早 07 : 45 按时送达

说起AI写作,可能很多人都听说过,之前的微软“小冰”写诗也应该都有记忆。但是知道这项技术发展的如何了吗?本文作者从AI写作的现状出发,对AI写作优缺点和其发展前景展开了分析,与大家分享。

作者:ruodbdl

题图来自Unsplash,基于CC0协议

全文共 5718 字,阅读需要 11 分钟

—————— BEGIN ——————

六一儿童期间,腾讯携手王俊凯推出了AI歌姬:当用户选择关键词后,可以输入个人的名字/昵称,然后AI能够自动生成歌词,之后会有一个童声与王俊凯来同时演唱这首歌,同时还会配上欢快的MV。

由于你的名字也会出现在歌声中,所以会给用户一种私人订制的感觉。

不过本次只能算是AI应用的一次试水,因为腾讯给出的关键词是有限的,而且相同关键词之间生成的歌词、歌曲一般只有两三个版本,很明显能看出预录的痕迹。

那么,目前AI创作到底到什么程度了呢?

01

AI写作的应用现状

文字是我们最常用来传递信息、表达情感和态度的文字,私人简短精炼的广告语、每日海量的新闻稿件、表达作者态度的诗歌和评论……

让AI来写作一般遵循从易到难的逻辑,先篇幅短再篇幅长、先模板化再半自动化再完全自由发挥。

目前AI写作也已经开始全面进入日常的生活之间,主要形式分成两部分:机器人写稿、人工智能协同写作。

1. 机器人写稿

我们先来看看“机器人写稿”模块,这一部分不需要人工参与,AI生成的内容就当做成品面向用户。

1)诗词歌赋

诗歌是一种有节奏和韵律、表达凝练、结构稳定、用于反映生活和表达情感的文学体裁。因为诗歌的规律显式、篇幅简短、且意象的使用具有统一性,所以AI学习写诗比较容易。

早在2017年,微软小冰就出版了《阳光失了玻璃窗》,包含139首现代诗,成为第一部人工智能诗集。里面的诗歌读起来比较优美,会给人诗歌的感觉,不过在整体性和逻辑性上还是有明显的瑕疵。

但是随着深度学习技术普及,现在写诗已经发展很快,古诗词、藏头诗、现代诗、特定风格的诗歌创作软件已经在市场上层出不穷。比如网易伏羲实验室与蜗牛读书馆合作训练的北岛风格写诗活动,在2019年赢得了广泛关注。

除写诗外,写词、对对联也一样开始进入大众生活,因为技术的普及,现在很多机构已经开放了AI创作接口,比如百度AI智能写作助手,”诗三百”公众号等。

2)广告

广告语、软文等都是广告的重要组成部分。Phrasetech等公司的服务可以自动生成公司网站、产品介绍页面、产品搜索结果摘要等。2019年,阿里「AI智能文案」功能进化,可以千人前面生成个性化卖点文案,每天生成智能文案超千万条。

京东的「AI闪电」平台也融合了之前李白和莎士比亚两大智能文案系统上的丰富实践和积累,在风格上可以选择不同的表达方式,例如专业、优美的写作风格,亦或是口语化的风格,用户能根据自身的需求进行不同的选择。除文字之外,阿里和京东都有配套的智能图片设计、AI智能排版、视频自动生成等功能,可以解决小公司或商家设计师和运营不足的问题。

3)新闻稿生成

写稿机器人依赖于自然语言生成技术,一般可分为三类:

第一类基于模板,预先设置好文章模板,再将数据库中的结构化信息包括具体数字、百分比等填充进去,进行传统意义上的“照本宣科”工作;

第二类是提炼整理,提取长文本中的关键信息,重新组织语言后输出;

第三种是纯算法生成,通常需要训练语言模型,对语言进行数学建模,然后根据输入的内容生成最符合原意且看起来流畅的文字。目前市场上应用最广的是前面两种。

AI小编已经为多家报社和新闻机构所采用。国外有美联社的WordSmith、华盛顿邮报的Heliograph和纽约时报的Blossom ,国内有新华社的“快笔小新”、 第一财经的“DT稿王”、《南方都市报》的“小南”、字节跳动的Xiaomingbot、腾讯财经的Dreamwriter。

其中腾讯推出的写作机器人Dreamwriter是由腾讯财经开发的一款自动写作新闻软件,可以在第一时间自动生成稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达用户。不少大型报业公司也已经在某些专栏中采用相关技术。

4)各种分析报告

分析报告与新闻稿其实大同小异,只不过报告的定制化更强,而且商业价值更高。

市场上常见的BI报告包括舆情分析报告、竞品分析报告等。用户可以提前设定分析的主体和维度,则机器人可以在全网搜集相关报道,再通过自然语言分析其情感倾向、侧重点、变化趋势、发展预测等,经过实时的计算可以生成客观及时的商业报告,这也已经成为很多数据平台的增值项目。

而在企业内部,AI也可以自动生成财务报表、业务分析报表等,不仅可以制作目录、图标等结构、还能够根据业务需求对数据进行分析,并得出初步的分析结论,既能够帮助运营人员快速定位问题,也能帮助管理层及时调整策略。

5)故事

除此以外,AI在写歌词、写剧本、写小说、教材,段子、辩论稿等方面有所突破。

早在2016年,在伦敦科幻电影节上,由纽约大学AI研究人员开发的递归神经网络“本杰明(Benjamin)”写出了一部时长9分钟的科幻电影”sunspring”,成为本届电影节48小时电影制作挑战赛的参赛作品之一。虽然它的编剧能力在当时显得很稚嫩,剧本中的语言也会显得混乱和莫名其妙,但是这种好玩的充满创造力的科技依然得到了一大批人的关注。

2018年 6 月 18 日,首个能与人类进行复杂辩论的AI系统IBM Project Debater在旧金山与人类辩论高手展开了两场公开辩论比赛。

在事前对辩论主题没有任何准备的情况下,AI系统不仅可以清晰表达自己观点,反驳对方论点,还一度比较准确地指出了对手所犯的事实错误。

而到了2019年,openAI的GPT-2模型出来后,在给定开头的基础上,AI已经能够续写以假乱真的故事。由于该模型以英文为主,故将其翻译成中文供大家阅读。

由于GPT2.0的效果实在是让人震撼,国内也有不少团队开始用这个预训练模型生成故事。

而前一段时间因为肖战的事情同人文社区AO3和老福特进入大家视野,这里面“博君一肖”的专栏上有大量的文章,网易根据这些现成的文章用GPT-2模型做了训练,结果也非常有意思。

从上面的示例可以看出,只要给AI一定数量的训练语料,AI就能学成风格类似的故事,这些故事虽然在逻辑上依然存在瑕疵,但是会给人一种魔改的吸引力,让你愿意一直阅读下去。而且随着技术的成熟、算力的提升、训练语料的优化,我们有理由相信它的创造能力会越来越让人惊叹。

同时,故事这里的想象力非常巨大,我们可以让AI来写脱口秀的稿件、可以让AI来写同人文、可以让AI来写短视频的剧本,不管是何种场景,都可以包装成有意思的玩法投放到市场上,也可以产生新的商业模式。

2. 人工智能协同创作

接下来我们再来看看人工智能协同创作部分,AI在这里主要是辅助人类进行创作,降低普通人创作的门槛。而且因为人工的介入,一定程度上保证了最终输出的质量。

1)素材选择

自媒体工作者是跟文字接触最多的人员之一,现在很多的自媒体工作者,需要经常更新文字来持续维持和增长流量从而获得收益。但是每日一更的时候,容易遇到写作缺乏灵感、积累的素材不够用、每日更新压力太大、难以及时发现热点话题等问题。”

而”百度智能创作平台(https://ai.baidu.com/tech/intelligentwriting)”、”get写作,一站式智能写作服务平台(https://getgetai.com/ )”等也已经在市场上对外开放。

2)素材指导、润色

AI写作辅助能够提升人类的写作效率。目前,百度、头条等自媒体都有自己的人工智能写作平台,主要用于后期根据语意纠错。目前的写作软件有点类似于作文素材大全,可以将描写人物、风景、地名等方面的内容整理出来,但是直接使用会出现剽窃抄袭等风险。

但如果经过AI来做二次创作,保留了最重要的意境,但是遣词造句又很不一样,也许能够取消创作者们的顾虑。不过,只言片语的文字并不能保证整个文章的优劣,最终还是要考验作者的组织和写作能力。

同时,网易云音乐等平台一直在推原创音乐人计划,扶植一批有创作能力的歌手。现在有很多的AI创作平台,可以帮助创作者们作词、谱曲、伴奏、甚至是生成MV,那么AI生成歌词也可以给创作者提供灵感,提高创作效率。

3)编辑校验等

AI不能完全胜任的场合,也可以通过更默默无闻的方式帮助人类。

在日常生活中,我们会发现智能输入法在打字时不停地猜测之后的内容,有时打个开头就能一路根据选候选词打完一句话。而在文本编辑时,编辑器也会提供自动校验服务,提示疑似有问题的内容,提醒作者修改。

在商业化方面,5月28日,微软宣布决定全面引入AI编辑替代人类来选编新闻。’新上岗”的AI算法将会代替人类编辑选取可报道的新闻事件、改写新闻标题、寻找文章配图等工作。

相关负责人声称此次裁员并非疫情期间的“应急”之举,微软其实很早就开始探索将AI技术应用到新闻实践中,此次裁员只是正常战略调整。但是在广告投入预算不断缩减、新闻行业逐步自动化的大趋势下,可以语料AI编辑也会被更多公司采用。

综上,AI已经在文字领域应用广泛,已能部分替代或辅助人类的工作。

02

AI的优缺点分析

1. AI优势

AI写作实力超卓,在某些方面人类早已不是对手。AI生成的优点包括学习内容广泛、创作速度快、不需要休息、客观。

与其说是学习内容广泛,不如说成是训练语料多。

根据你的应用场景和效果预期,整理尽可能多的文字材料给到AI来训练。通常来说,AI训练语料的最低要求已经超过正常人的阅读量,更不要说正常人能够记住的文字。

而且,AI能够持续抓取网络上的新内容,跟进新的热点、事件和词汇。所以,人类作家的知识储备和精力是有限的,当遇到未知领域就要去补充知识。

但是AI创作的素材很多,可以写出不同领域、不同风格的内容,只要前期给到充足的数据,需要用到的时候近乎随时可以调取。例如openAI可以随时生成属于科幻和生物方面的内容,而网易可以生成同人文等风格的故事。

在新闻、报道等内容中,对事件的真实描述、数据的正确统计、客观平衡的立场,是给受众带来价值的基础。

但是人类都是有立场和情感的,因此可能会为了立场而伪造数据或细节,从而误导市场和投资人,比如前一段时间的瑞幸咖啡。

同样在情感方面,由于立场不同,大家看待问题的角度会不一样,态度在时评或个人文章中是非常重要的存在,但是在新闻等需要客观阐述的内容中,就容易带来问题。人类由于自身经历、知识水平不同,对于获取到的内容、信息看法并不能做到完整、客观。

AI遵循训练出模型网络,完整分析所有输入。

同一个模型、参数下AI给出的结果是完全一致的,也就是说:同一个AI对任何输入都使用同一套评价标准;而AI是一个没有感情的模型,只要固定模式,就能够不偏不倚地一直应用下去。

AI的创作速度很快,对于人类主动搜索、阅读整理数据、构思文章遣词造句、最终输出内容而言,每个环节都需要付出相当大的时间来思考和梳理,而AI能实时抓取最新数据并作出分析,其全面性和速度远远超出人工。在生成方面,其模型的推理速度也远比人类思考要快很多,因此在计算资源足够的情况下,模型可以在秒级生成文字。

AI也不会出现疲惫,连续工作的状态下也能保证高质量的输出。很多规则明显的工作交给AI来做准确率和覆盖度都会更高。因此,像AI采编等基本可以通过程序来进行。这样可以节省大量的人力。

2. AI劣势

AI容易被不法分子利用。现在AI创作在伦理道德和法律上都缺乏完备的配套,而AI本身也难以区分善恶真假,因此一旦技术普及,可能会带来诸多风险。

例如假新闻会给大众带来误导、生成的剧情可能会侵犯用户的名誉、过得使用文章扩写甚至会引导舆论。因此,AI生成内容的版权、归属、责任都需要尽快有清晰的规定,这样才能规避问题,或者在问题出现后快速解决。

其次,现在模型的训练成本很高。openAI新出的GPT-3模型有1750亿个参数,训练一次的成本高达1200万美元,一般的公司很难承受这个成本。

另外,AI的版权很难判别。在模型开放的情况下,AI的效果取决于训练语料。但网络中的语料很难判定归属权。因此,AI的产出应该属于哪一方呢?如果有另外一个AI模型也产生类似的效果,算不算抄袭呢?

在AI创作越来越以假乱真的今天,这个问题开始进入大家的视野。但是不同国家对这个问题的看法都不一样,目前也还没有一个权威的法律来约束大家。

但我们相信,这个问题一定会迅速得到解决。

03

AI的发展前景

随着模型完善和算力提升,AI的写作能力已经得到了大家的认可,并在日常的生产生活中扮演不可或缺的角色。

但受限于技术和法律的不完善,AI写作依然存在一定的风险:主要是目前机器人本身难以区分是非善恶,也缺乏态度和立场,如果训练内容存在问题,或者用户的输入刻意引导,AI就会生成一些违背人类道德规范的内容。

比如生成假新闻,扭曲事实的真相,煽动普通大众的错误情绪。也可能会生成不当言论,比如种族歧视等。

另一方面,AI写作的能力已经对人类社会的既有运行模式带来冲击。微软的AI智能审核已经正式上岗,让原本从事这一工作的人失去了工作。而AI写新闻、写报告,也会让不少水平的人员被替换掉。这时候就有人来鼓吹焦虑了,AI会来抢人类的工作,影响人类的生活。

其实并不尽然,AI能取代的主要还是相对固化、简短的工作内容;对于创造性很强、抽象程度高的场景,AI还是以辅助为主,不仅不会取代人类,还会成为人类的助力。同时,AI也创造了不少新的工作岗位:像AI训练师、语料标注员等。

不过新技术的快速发展,在给经济社会发展带来新机遇的同时,也增加了其被误用、滥用的风险。因此,需要新的规范来防范,需要有强有力的引导政策来保障。

—————— / END / ——————

▼ 喜欢请分享,满意点个赞,最后点「在看」 ▼

提示:支持键盘“← →”键翻页
为你推荐
加载更多
意见反馈
返回顶部