100年前的老影像,用人工智能上色后是怎么样的?
5月9日,大谷通过自己的个人微博“大谷Spitzer”上传了一段100多年前老北京的纪录片,有意思的是,这段原本黑白色的影片被大谷用人工智能的方式添加了色彩,100多年前的北京和城内的人们就这样灵动了起来,天桥上热闹的集市、寺庙里的人们、巷子口独特的礼仪……有网友称,视频中原本色彩单调、轮廓模糊的人影,经过修复后,变得面目清晰、动作流畅,好像穿越了一般。这段视频在发出24小时后,有近50万点赞,10多万次转发和接近3万条留言,播放量在微博上达到近2000万次。
制作者大谷,一名北京90后,现旅居美国纽约。在其个人微博介绍中,他称自己是程序员里最会画画的作曲家。在接受红星新闻独家采访时,大谷说,看到成片之后,自己还是蛮震撼的。
大谷
给这段视频上色,前后花了7天时间
红星新闻:怎么想到要给这段影片上色?
大谷:我本身就是做科普的,在B站经常做科普相关的视频,差不多有七年了,主要是一些绘画和作曲教程。最近一两年我开始接触人工智能这方面的知识。之前看到有这种旧电影的恢复技术,就想尝试一下,学会之后再做一个教程视频来教大家怎么去做。
红星新闻:选取老北京的这段视频有什么特别的原因吗?
大谷:我本身就是北京人,对北京的文化比较了解。大概2016年的时候看到《人民日报》的微博发过这段视频,当时就挺吸引我的,因为里面有很多对视的片段,让人有一种古今交流的感觉,就好像通过屏幕和一个个100年前的人在对视,感觉非常奇妙。
红星新闻:上色的具体步骤是什么?大概花了多长时间?
大谷:整个流程走下来差不多七天左右,修复过程主要用了三种AI工具,分别用来补帧、上色和分辨率扩增。原版纪录片每秒只有6到10帧,看起来非常卡顿。我用DAIN(AI工具名称)来补充中间的画面,让视频变成每秒播放60帧左右。最后对颜色做了整体修改,让它再鲜艳一点。在前面我又加了一个简单的介绍。
对,还加了很多音效。因为这个本来是默片没有声音,音效都来源于互联网,就仅作学习交流使用,选用的是一些北京民俗的经典录音,包括像阎秋霞、骆玉笙老师的作品打底,还加入了一些吆喝声,让它更有北京味儿。
视频截图
已得到一些合作邀约,但目前还在商量阶段
红星新闻:自己看到成片后是什么感觉?
大谷:看到成片之后我还是蛮震撼的,真的是有回到了老北京的那种感觉。因为疫情原因,今年我没有回国,去年也没有,自己还是很怀念北京的,当年没事儿就出门遛遛弯儿,走到前门走到王府井,四处逛一逛,还是非常怀念那个时候。
另外,因为最开始看到这个记录片的时候,就有一种古今交流的感觉,里面有很多细节都非常有趣。但因为原片是一个加速版的老电影的感觉,人物走路速度都非常快,很多细节在黑白的电影当中很容易漏掉,得仔细看才能看到。所以恢复成彩色正常速度之后,大家就会看到很多很有趣的小细节,躲在树后面偷窥的人啊,偷偷看屏幕的那哥们儿,或者是一些烧香拜佛的细节啊,包括老北京的礼仪啊,都蛮有趣的。
视频截图
红星新闻:是否还有一些遗憾的地方?
大谷:我觉得比较遗憾的地方就是它的历史准确性肯定还是打折扣的,毕竟它是一个人工智能,还在学习阶段,很多数据库是来自欧美的,对中国文化的掌握并不是非常熟练,很难说完美地还原了当时的服饰颜色。但是确实帧数提高了,画面整体的质量也上升了,给人的感受也大不相同,好像真的穿越回那个年代了一样。
红星新闻:接下来是否还会有为老纪录片上色的计划?
大谷:是的,目前还在收集资料的阶段,因为如果是北京以外的地区,我还要找当地人去了解当地的民俗,再去做进一步完善,像北京我比较熟悉,所以配乐什么的就比较容易。
红星新闻:这段视频火了以后,对你的生活是否有一些改变?
大谷:我是真没想到这段视频会这么火,我是觉得大家可能会有共鸣,尤其是北京人,看这个视频肯定会有相当多的共鸣。但上热搜,这就非常出乎我的意料了。我的生活还和以前一样,我现在在纽约嘛,这边疫情比较严重,就宅在家里学学技术,我的主业还是做游戏开发,继续做我的漫展模拟器,希望能早日上线。
但因为视频火了嘛,我也有看到一些合作邀请,目前还在商量阶段。对我来说,主要还是希望把这些技术分享给大家,一起来修复一些老电影老的纪录片啊,都是蛮不错的。
人工智能会淘汰一些旧岗位,但也会增加一些新职业
红星新闻:你的微博个人介绍说自己是程序员里最会画画的作曲家,这有什么故事吗?
大谷:我是北京人,从小在北京读书,后来考上了中国人民大学徐悲鸿艺术学院美术专业。2014年本科毕业后,就到纽约视觉艺术学院进修研究生的计算机艺术专业,2016年毕业之后就暂时旅居在这边,做一些艺术、游戏开发、音乐作曲相关的工作。目前我一直在开发一个游戏《漫展模拟器》,音乐程序美术都是我独立在做,是B站来做发行,在steam上已经制作了两年左右了。
其实我定义自己是独立艺术家、独立游戏开发者,就是做我自己喜欢的事情,并且把我的一些感受分享给大家,就跟我做科普视频的教程一样,就是给大家分享一些我感兴趣的东西,然后让大家一起来创作更多的作品。
红星新闻:你在B站也上传了很多AI相关的视频,是如何萌生对AI的兴趣的?
大谷:我是想通过这些作品,给大家展示一下,人工智能不是一个高不可攀的东西,大家都可以学习、运用这些技术。
红星新闻:谈到AI的时候,很多人会持否定态度,觉得会让人类失业等。你怎么看?
大谷:我觉得凡事都有两面性。一个新技术的出现,可能会淘汰一些工作岗位,但它也会增加更多的工作岗位。像人工智能其实是可以解放艺术家的双手,让他们有时间来做更多的创作,比如人工智能作曲,其实并不是说我把曲子扔进去,让人工智能帮我做音乐,我是要进行一定的指导,需要把我的曲子倒进去,然后去选择哪个年代的作曲家来完成。任务只能学习莫扎特贝多芬的风格,我会根据它来激发我更多的灵感来进行下一步的创作。所以我觉得未来也许艺术家会越来越多,包括编程的岗位也会很多,会有更有意思的新职业出现,人工智能的未来还是比较积极的。
红星新闻记者 邱峻峰 图据受访者 编辑 李学莉
(本文来自红星新闻APP,请至各大应用市场下载)