让总统踹门、女神下海,AI 带来了多少以假乱真的可能?

国内新闻 浏览(1842)

出海女神是所有宅男的梦想,大多数人只能在心里想,但是一些技术公司已经用自己的双手解决了这个问题。最近,一部以“神奇女侠”演员盖尔加朵为“主角”的黄色短片开始在网上流传。仔细观察发现,盖尔加朵的脸只是“换了”给别人,视频中的主角不是女神本人。

这段视频来自国外的红迪论坛。作者是一个名叫deepfakes的网民。除了《神奇女侠》盖尔加朵,他还有许多其他作品,包括艾玛沃森(赫敏)、麦茜威廉姆斯(尔雅)和斯嘉丽约翰逊(黑寡妇)。这些视频都是用人工智能技术合成的。

这不是尖端技术,可以通过使用开源项目来实现。

没有人能100%模仿别人的脸。就连日本成人电影中的波多野结衣和东尼大木也只是从某个角度与明星相似,再加上网民的恶搞,这在网上变得很流行。这个“场景变化”的盖尔加朵视频不是模仿秀,也不是复杂的电脑动画技术。它只依靠现有的人工智能开源项目,利用机器学习进行大量训练,然后合成色情短片。

deepfakes不是专业研究员,但只对机器学习感兴趣。他使用的所有技术都是基于开源软件,如TensorFlow和Keras。Deepfakes利用谷歌照片搜索、公共画廊和YouTube视频收集了大量图像,然后利用这些材料来训练深度学习网络。经过反复训练后,系统可以识别出正确的盖尔加朵图像,并且该算法会自动使其他图像更加类似于训练对象。

deepfakes在Reddit中提到,他使用的算法类似于Nvidia不久前用来改变天气的技术。英伟达使用创生对抗网络(GAN),擅长处理视觉数据,产生更清晰更锐利的图像。Nvidia可以利用这项技术将视频从晴天转换成雨天,从而欺骗了视觉。

一些人工智能行业的研究人员说,这不再是尖端技术,用消费者图形卡处理这种效果只需要几个小时。

我怎样才能完善女神的细节?

如果你仔细看这段视频,你会发现盖尔加朵的脸和他的身体不太协调。偶尔会有错位和扭曲。有时候,声音和嘴巴是不匹配的。考虑到这只是一个程序员的个人工作,达到这一水平令人震惊。

机器学习需要大量材料来训练。即使名人被选为训练对象,他们也无法获得完美的面部表情。Face2Face可以解决这些细节。利用人脸跟踪技术,真实人物的面部细节可以被复制到现有的视频中,这些视频可以用来制作大量具有面部细节的视频素材。

如果我们有更大的野心,我们能解决口型的问题吗?答案是肯定的。

华盛顿大学的研究人员开发了一种新的算法,可以将一个人的声音转换成相应的嘴型,然后将其移植到现有的视频材料中,生成一个全新的视频,其中嘴唇的运动几乎完全符合这个人说话时的声音。

研究人员使用的材料是奥巴马,因为深度学习算法需要大量数据支持,他的视频在互联网上有更多的材料,所以机器学习将更容易实现。据研究人员称,整个学习过程需要17小时的视频作为培训材料。从技术上讲,任何人的声音都可以放在别人的脸上。(视频连接到)视频左侧是原始视频。右边是算法合成的新视频,使用了左边视频的声音,但图像是新生成的。

嘴形的问题解决了,所以我们会得到一个由盖尔加朵的脸、色情明星的身体和声音组成的视频,嘴形和声音可以同步。当然,熟悉盖尔加朵的人肯定会注意到这种差异,毕竟声音并不符合人。

既然可以创建图像,那么声音呢?

在2016年奥多比麦克斯会议上,开发者展示了一个名为VoCo项目的软件代码。它不同于以前的音频编辑软件,您可以在声音中直接插入和更改一些单词。理论上,VoCo项目可以理解一个人的声音组成,只要有大约20分钟的录音就可以再现出来。也就是说,它可以用来产生一个你从未说过的演讲,但它是在

编辑听起来像Photoshop的技术并不是乌托邦。名为描述()的音频编辑软件已经正式推出。将声音转换为文本后,您可以编辑文本以剪切、复制、粘贴、删除和插入音频。当然,可编辑音频的数量取决于素材的丰富程度。

描述,像项目VoCo一样,可以基于现有的声音材料进行编辑。重现一段文字仍然很困难。如果你想在色情电影中听到完美的声音再现,你还应该考虑情绪、情感和其他因素的影响。否则,产生的视频只能是鬼影效果。

使用Face2Face制作带有面部表情的视频素材,使用音频编辑软件生成声音素材,然后使用deepfakes的机器学习系统来改变面部,并使用华盛顿大学研究人员的技术来使声音与嘴形相对应。这样,声音、图像、表情和嘴巴形状的问题就解决了。

技术困难不是唯一的限制。

使用技术恢复角色的做法在电影中出现过多次。《速度与激情 7》年,已故的保罗沃克(paul walker)被CG技术修复,《星球大战外传:侠盗一号》年,彼得库欣(peter Cushing)被修复。这些计算机生成技术非常困难而且成本高昂。人工智能技术和机器学习的普及使得制作假视频变得更加容易。

几年前,互联网上有一段奥巴马踢门的流行视频,后来证明是通过编辑创作的。如果这些场景在今天用人工智能实现,恐怕微型商人不需要20万元就能和美国前总统拍照。

困难不是实施新技术的唯一限制。我们应该更多考虑的是滥用这些技术造成的道德、伦理、版权和其他问题。直播和短视频等平台产生了大量的内容,手机的人脸识别功能也变得流行起来。如果这些数据被恶意使用,对个人和社会的影响将是无法估量的。

人工智能可以创造女神或魔鬼。

youtube.com