创业100联盟 创业服务联盟( 六 )


第二部分就是大数据下的感知智能 。深度神经网络包括三种类型 , 一种是深度卷积神经网络 , 一种是深度信念网络 , 一种是深度自动编码器 , 06年取得了突破性的成果 , 一个就是Hinton 。深度卷积神经网络是75年提出的 , 该模型第一次引入了局部感受野、卷积和ReLU的思想 , 实际是目前炙热的卷积神经网络的最初版本 。它真正发扬光大就是这个人 , 就是Yann Lecun , 95年的时候他称之为卷积神经网络 , 最早叫认知机 。在89年的时候 , 把误差反向传播引入了CNN 。第二个成果就是95年卷积神经网络的概念被提出 。06年深度CNN模型被提出 , 同时以0.39%的错误率 , 刷新了MNIST数据集的历史记录 。目前的世界记录是0.21% 。
这个网本身提出了一些特征 , 它跟以前不相同 , 以前所有特征都是人工设计的 , 这个特征可以自动提取 , 有低层特征和中层特征和高层特征 。标志新的成果是2012年 , 当时Hinton的博士生系统地提出了一种基于GPU迅速的深度CNN , 在具有1000种物体类别的ImageNet分类竞赛中取得了当时最好的成绩 , 错误达到了15.3% , 由此揭开了深度学习在计算机视觉 , 语音识别和自然语言处理理解中大规模研究的序幕 , 产业开始真正深度介入 。我们在80年代90年代初的时候这个领域非常热 , 所有领域都搞神经网络 , 但是那时候产业界从来没有进来 , 都是学术界做的 。
深度卷积网络视觉物体识别能力 , 这是基于Deep CNN公开评测的数据 。大数据:真实条件下有标签的巨量数据跨国企业的私有大数据的资源 , 其重要性如同原油一样 。深度学习主要是靠大数据 , 还有GPU的应用 。
在2014年的分类竞赛中 , 谷歌做的事情就是谷歌Net网络 , 22层的深度网络 。还有牛津大学的VGG , 这个不说了 。人类对ImageNet数据集TOP—5的错误率为5.1% , 上个月的记录是到了3.08% 。针对ImageNet1000种物体的识别 , DeepCNN超过了人类的识别能力 。数据从06年到2012年六年的时间 , 当时产业界并没有重视 , 也没有大数据进来 , 然后2012年跨国企业全进来了 , 2012年到2015年 , 现在每个月都可以看到数据的不断更新 , 可以看到非常明显的趋势 。
再举个例子 , 就是人脸识别 , 现在也是DeepCNN超过了人类的识别能力 , 我们从2014年开始 , Deep CNN成为人脸识别的主流方式 , 大数据成为性能提升的关键 , 例如FaceNet达到了2亿 , 传统视觉识别方法最好的结果是96%左右 , 基于LFW数据集 , 判断两张陌生照片中的面孔是否同一个人时 , Facebook中每天8一张照片中监测或识别特定用户的面孔或进行自动标签处理 。还有这个是9层卷积层 , 1.2亿连接权 , 香港中文大学的XOTang等的DeepID2+正确率为99.47% , 超过了人类97.53%的正确率 , 谷歌最新的FaceNet达到了99.63% 。针对德国交通标志识别率的 , DeepCNN超过了人类的识别能力 , 人类是98.84% , 采用Deep CNN是99.81% , 这是去年年底的事 。
Deep CNN的检测与定位分割能力 , 正在成为全球的研究热点 , 其突破将推动AI的实际应用于产业发展 , 模拟生物视觉皮层的背侧通路 。对多尺度的滑动窗口应用DeepCNN , 这个时间代价非常少 , 现在还有GPU和芯片的 , 这块都可以支撑它的实时性 。这是Facebook做的 。Deep CNN+再励学习:正应用于神经动态规划问题中 , 取得了以阿尔法狗为代表的里程碑式的胜利 , 引起了全社会的关注 。