这是一幅由谷歌公司2005年开源的 AI程序“DeepDream”创作出来的艺术作品。谷歌的另一项利用机器学习创作音乐、艺术作品的项目Project Magenta也发布了一个名为 NSynth (Neural Synthesizer)的神经声音合成器。
时间回溯到20世纪90年代中期的山景城加利福尼亚,当时道格拉斯·艾克还是美国阿尔伯克基市的一个数据库程序员,业余时间则兼职做个音乐人。在能源部的实验室里写了一天的电脑代码之后,他就会在当地的一个小酒吧里表演,演奏他所说的“朋克范儿的蓝草音乐(蓝草音乐,一种乡村音乐)”--他管这叫做“Johnny Rotten遇上 Johnny Cash”(前者是英国朋克摇滚乐团“性手枪”的主唱,后者是美国乡村音乐创作歌手)。但他真正想做的是把自己的主业编程工作和业余的兴趣爱好结合起来,利用机器来创造一种独特的音乐。“将人工智能和音乐结合在一起是我毕生的唯一心愿”,艾克说道。
这个想法雄心勃勃却略显稚嫩。那时道格拉斯·艾克就读于离家不远的布卢明顿的印第安纳大学,他把这个想法抛给了认知科学家道格拉斯·郝夫斯台特(Douglas Hofstadter),其研究意识与机器间关系的著作《哥德尔、埃舍尔、巴赫:集异璧之大成》(G?del, Escher, Bach: an Eternal Golden Braid)还获得了普利策奖。却不曾想郝夫斯台特迎面给他浇了一盆冷水,坚称当前即使是最先进的人工智能技术也远远不够成熟。但在接下来的二十年里,在科研一线工作的艾克孜孜不倦地坚持着自己的想法,最终,人工智能发展水平赶上了他的野心。
去年春天,在 Google做了几年的研究工作之后,艾克又重新拾起了多年前曾向郝夫斯台特提起过的想法。这一想法付诸实践后便有了Project Magenta的诞生。谷歌研究团队不仅让这些开发出来的机器人学会了如何制作独特的音乐,还能使它们创作出包括素描,视频甚至笑话在内的多重艺术形式。继在智能手机、应用软件和互联网服务等多项领域称霸后,谷歌又在着手开发通信业务,艾克则将Magenta视为这项业务自然而然的衍生物。
“这为人们创造了全新的沟通方式,”最近在谷歌人工智能研究总部接受的一次采访中,艾克这样说道。
该项目一方面也为利用人工智能技术创作艺术作品的实现作出了不懈努力,而人工智能也只是近些年来才趋向成熟的一门技术。所谓深度神经网络(deep neural network)就是利用分析大数据来学习特定的行为的一种复杂数学系统。例如,通过在数以百万计的自行车照片寻找其共同的模型与款式,由此来学会如何识别自行车。这就是社交软件Facebook识别在线照片中的面孔所应用到的原理,安卓手机能够识别口头指令,以及微软的通讯软件Skype的翻译功能同样依赖于这项技术。不过这些复杂的系统同样也可以创造艺术。例如,通过分析一组歌曲,它们可以学习如何制作类似的声音。
正如艾克所说,要想使得机器能做制作出一首,或者夸张地说,乃至数万亿首的披头士乐队的新曲,而且每首听起来既像是甲壳虫乐队自己录制的音乐,又与其有些许差异,距离这个结果的达成仍要数年的时间,但至少这些系统已经在向这个方向靠拢了。不过这种创作方式虽说创造出了艺术,但最终从某种意义上来说又渐渐地瓦解了艺术,这样的结果并不是他所追求的。除了模仿之外,还有很多其他的创作途径值得探索。人工智能最终的理念不是取代艺术家,而是为他们提供工具,让他们以全新的方式去创造艺术。
二十世纪九十年代,艾克在新墨西哥州的小酒馆里将Johnny Rotten and Johnny Cash的音乐糅合在了一起;现在,他正在构建可以实现相似效果的软件。利用神经网络,他和他的团队把从各个乐器(比如像巴松管和古钢琴的结合)中提取出的声音混合在一起制造出人们闻所未闻的声音。
另一幅利用“DeepDream”创作出的作品。“DeepDream”可以利用神经网络把一幅现成的照片生成为诸多的抽象图片。
就如同通过分析上百张猫的照片来学习如何识别猫一样,神经网络也可以通过分析数以百计的音符来学习巴松管的音乐特性,其可通过创建数学表达式,或者说一系列矢量以识别巴松管。由此,艾克和他的团队已经将上百件乐器的发出的音符输入了该神经网络,为每一门乐器都建立一个特定的矢量。现在,只需在屏幕上动动按钮,它们就可以结合部分矢量从而创造出全新的乐器:可能这门乐器发出的音色47%来自巴松管和53%来自古钢琴,另一门乐器则是将这个比例颠倒了过来,以此类推。
几个世纪以来,管弦乐的演奏都是不同乐器间乐音的相互交叠。但现在不同以往了,乐音不再是重叠交织的了。艾克和他的团队正在把几种乐器的音色糅合在一起,为艺术家创造出前所未有的新的演奏方式。“我们正在制作下一代电影摄影机,”艾克说。“还有新一代的电吉他。”
这个特殊项目,也就是所谓的 NSynth,目前还只是处于起步阶段。但是,在艺术界和科技界中,许多人已经开始对通过神经网络和其他人工智能技术来创造新艺术的做法跃跃欲试了。“这项技术在过去几年中发生了突破性的进展,”洛杉矶的摄影师兼艺术家亚当·费里斯如此评价道,“这是一项全新的美学形式”。
2015年,谷歌公司内部的一支独立研究团队开源了DeepDream,这套程序工具可以利用神经网络,从现成的照片中生成出颇具迷幻效果而令人印象深刻的“梦境图像”,而且目前对这项技术在创造新式艺术上的应用已不仅仅限于谷歌一家公司了。如果该程序解析了一张关于狗的照片,并在图中发现了一根形似眼球的狗毛,图片效果就会着重强调这根狗毛并不断重复这个过程,直至整只狗被旋转的眼球图案所覆盖。
与此同时,一些艺术家,如著名的多媒体表演艺术家特雷弗·帕格恩 (Trevor Paglen )或较为小众的亚当·费里斯正在以其它方式来探索神经网络的运作方式。1月份的时候,帕格恩在旧金山一间陈旧的海运仓库进行了一次表演,借用神经网络可以追踪人类观察方式和移动路径的特性,对计算机视觉的伦理性进行了探索。例如,当先锋乐团克洛诺斯四重奏乐团(Kronos Quartet)的成员在台上演奏时,神经网络能够实时分析他们的表情,猜测他们的情绪。
态度之于工具,就像老瓶装了新酒。曾制作诗歌生成软件的纽约大学教授艾莉森·帕里什(Allison Parrish)指出,艺术家们早在自二十世纪五十年代开始就已经在使用计算机进行创作了。她说:“正如杰克逊。波洛克(ackson Pollock)所想到的一种新的绘画手法一样,他所做的就是打开颜料罐,把颜料肆意挥洒在帆布上。”这些新的计算机技术为艺术家们创造了一块色调更丰富的调色板。
一年前,戴维·哈(David Ha)还是东京高盛集团下的一名交易员。一到午休时间,他就开始把玩神经网络,并将制作出来的结果放在自己化名下的博客上。此外,他还建立了一个可以自行写下日文汉字的神经网络,这种日文汉字与其说是写出来的,倒更像是画出来的图案。
不久后,艾克和谷歌公司的其他成员发现了该博客,现在哈正在谷歌公司着手研究Magenta项目。利用名为 SketchRNN的项目,他正在构建可以绘制图案的神经网络。通过分析几千张普通人绘制的电子版速写画,这些神经网络可以学习绘制像猪、卡车、小船或瑜伽姿势之类的图像。不过他们不抄袭别人画过的东西,他们有自己的画法,会选择从数学的角度来辨别猪的形态。
比方说,你可以要求它们画一只安上猫头的猪,或从缺了一只马蹄的马匹,又或者画出一辆形似小狗的卡车,用任意几条弯曲线条造出一艘小船。就像对待NSynth或 DeepDream一样,艺术家们不大可能会用这些新工具来创作艺术作品,但是,如果你一旦尝试了这种技术,你就会发现他们是是由哈创造出来的自成一派的鲜活作品。人工智能不只是创造新的艺术派别,它正在创造新型的艺术家。
编辑:江兵