2024-09-12 13:50:02 砍柴网(百家号)
仅在2024年上半年,IEEEXplore数字图书馆就发表了300多篇专注于为深度伪造创建检测工具的文章。
IEEE高级会员Aiyappan Pillai表示:“在人工智能使深度造假算法能够制造出更难检测的赝品的同时,人工智能检测技术也在通过采用不同的技术和算法来识别伪造品。”
什么是深度伪造?
深度伪造一词是两个术语的混合: 深度学习和伪造。深度伪造是人工智能生成的逼真视频、音频片段或静止图像,描绘了真实的人做或说他们没有做过提过的事情。近年来,这种深度伪造出现在了政治领域,同时也影响了娱乐界。深度伪造可能会通过模仿流行音乐行为的歌曲来扰乱娱乐经济,而这些歌曲通常未经表演者授权。
新兴检测方法
目前存在两大类技术用于识别深度伪造,并且已经进行了大量研究来确定它们的工作效果。
·机器学习: 识别深度伪造的一种方法是向机器学习模型提供大量深度伪造和真实内容,以便它能够学习发现它们之间的差异。这些技术可能根本不涉及机器视觉。相反,它们将图像转换为数据,并从其模式中学习。如果一个新的深度伪造与训练的数据有显著差异,那么这种方法的一个挑战可能是难以识别它。
·语义分析: 与依赖原始数据的机器学习方法相比,语义分析使用与帮助人工智能系统识别图片中的苹果或书籍相同的机器视觉技术来查看图像的内容和上下文。这些方法可以分析说话者面部的血流模式、头部的形状,或者他们的外表是否随着时间的推移而保持一致。语义分析还涵盖了没有意义的对象之间的关系。例如,想象一个浴室的建筑渲染。人工智能生成的图像可能会将淋浴头放置在无法正常使用的位置。
数字水印
识别深度伪造的需要导致一些生成性人工智能公司为此目的创建标记。在某些情况下,用户可以看到这些标记;在其他情况下则相反。
IEEE高级会员Rahul Vishwakarma说:“检测深度伪造最有效的技术之一是使用生成式AI平台对生成的图像进行数字水印。”
偏见问题
大约有五六个常用的数据集——人的视频和图像——被用来训练深度学习模型来检测深度伪造。一个数据集完全由名人组成。研究人员面临的一个挑战是,这些数据集中的人更有可能是白人和男性。这引发了人们对深度伪造检测工具在面对来自不同背景的人的数据时是否会遇到困难的质疑。
人类或许表现更好吗?
虽然深度伪造是真实的,但人类可以发现它们。最近发表在IEEE Privacy & Security上的一项研究将人类与机器对立起来。研究人员发现,平均而言,人类能够识别大约71%的深度伪造,而尖端的检测方法能够识别93%。
然而,一些深度伪造图像欺骗了检测算法,但人类能够发现骗局。
有些人比其他人更善于发现深度伪造,但研究人员才刚刚开始研究原因。在另一项研究中,研究人员考察了警察和“超级识别者(super-recognizers)”检测深度假货的能力。超级识别者的能力得到了实验室的认证,他们是真正擅长识别和辨认人脸的人。研究表明,超级识别者在识别深度伪造方面并不比普通人好。这表明,能够判断某物是否是深度伪造与善于识别人脸不同。