如何进行图像识别图像识别算法有哪些( 二 )

研究人员故意制作存在矛盾的图片，也就是说将一种动物的形状与另一种动物的纹理拼在一起，制作成图片。例如：图片中的动物轮廓是猫，但是猫披着大象纹理；或者是一头熊，但它们是由铝罐组成的；又或者轮廓是飞机，但飞机是由重叠的钟面组成的。
研究人员制作几百张这样的拼凑图片，然后给它们标上标签，比如猫、熊、飞机。用4种不同的分类算法测试，最终它们给出的答案是大象、铝罐、钟，由此看出算法关注的是纹理。
Columbia大学计算机神经科学家Nikolaus Kriegeskorte评论说：“这一发现改变了我们对深度前向神经网络视觉识别技术的认知。”
乍一看，AI偏爱纹理而非形状有点奇怪，但细细深思却是有理的。
Kriegeskorte说：“你可以将纹理视为精密的形状。”
对于算法系统来说精密的尺寸更容易把握：包含纹理信息的像素数量远远超过包含对象边界的像素数量，网络的第一步就是检测局部特征，比如线条，边缘。
多伦多约克大学计算机视觉科学家John Tsotsos指出：“线段组按相同的方式排列，这就是纹理。”
Geirhos的研究证明，凭借局部特征，神经网络足以分辨图像。
另有科学家开发一套深度学习系统，它的运行很像深度学习出现之前的分类算法——像一个特征包。
算法将图像分成为小块，接下来，它不会将信息逐步融合，变成抽象高级特征，而是给每一小块下一个决定，比如这块包含自行车、那块包含鸟。再接下来，算法将决定集合起来，判断图中是什么，比如有更多小块包含自行车线索，所以图中对象是自行车。算法不会考虑小块之间的空间关系。结果证明，在识别对象时系统的精准度很高。
研究人员Wieland Brendel说：“这一发现挑战了我们之前的假定，我们之前认为深度学习的行为方式与旧模型完全不同。很明显，新模型有很大飞跃，但飞跃的幅度没有大家预料的那么大。”
约克大学、多伦多大学博士后研究员Amir Rosenfeld认为，网络应该做什么，它实际做了什么，二者之间仍有很大差异。
Brendel持有相似观点。他说，我们很容易就会假定神经网络按人类的方式完成任务，忘了还有其它方式。

向人类视觉靠近目前的深度学习技术可以将局部特征（比如纹理）与整体模式（比如形状）结合在一起。
Columbia大学计算机神经科学家Nikolaus Kriegeskorte说：“在这些论文中有一点让人感到稍稍有些奇怪，架构虽然允许这样做，不过如果你训练神经网络时只是希望它分辨标准图像，它不会自动整合，这点在论文中得到明显证明。”
如果强迫模型忽视纹理，又会怎样呢？Geirhos想找到答案。团队将训练分类算法的图片拿出来，用不同的方式给它们“粉刷”，将实用纹理信息剔除，然后再用新图片重新训练深度学习模型，系统转而依赖更全局的模式，像人类一样更加偏爱形状。
当算法这样行动时，分辨噪点图像的能力同样更强了，虽然在此之前研究人员并没有专门训练算法，让它识别扭曲图像。
对于人类来说，可能自然而然也存在这样的“偏爱”，比如偏爱形状，因为当我们看到一件东西，想确定它是什么时，靠形状判断是最有效的方式，即使环境中有许多干扰，同样如此。人类生活在3D世界，可以从多个角度观察，我们还可以借助其它感知（比如触觉）来识别对象。所以说，人类偏爱形状胜过纹理完全合理。
德国图宾根大学研究人员Felix Wichmann认为：这项研究告诉我们数据产生的偏见和影响远比我们认为的大得多。之前研究人员也曾发现相同的问题，例如：在面部识别程序、自动招聘算法及其它神经网络中，模型过于重视意料之外的特征，因为训练算法所用的数据存在根深蒂固的偏见。想将这种不想要的偏见从算法决策机制中剔除相当困难，尽管如此，Wichmann认为新研究证明剔除还是有可能的。

如何进行图像识别 图像识别算法有哪些( 二 )

如何进行图像识别图像识别算法有哪些( 二 )