专访简仁贤:如何用情感交互拯救智障的机器人?AI英雄

本文系网易智能工作室(公众号smartman 163)出品,此篇为《AI英雄》专访第28期 。聚焦AI,读懂下一个大时代!
作者小羿
我问自己,为什么会爱上你
我感觉一切忽然都不重要了
我所掌握的所有执念都消失了
我找不到明确的答案,我也不需要明确的答案
我相信自己,相信自己的感觉
我不想再尝试成为,真实的我以外的东西
我希望你会接受这样的我
——萨曼莎
这是电影《Her》中女主人公人工智能系统萨曼莎对身为人类的男主人公西奥多的爱情表白 。这部电影获得了第86届奥斯卡最佳原创剧本奖,也勾起了人们对于未来世界的憧憬 。简仁贤便是是深受这部电影影响的人之一 。
作为前微软(亚洲)互联网工程院副院长,微软小冰研发的奠基人之一,简仁贤在2015年为了让机器人具备情绪情感,毅然走上了创业之路 。如今,他创立的情绪情感识别公司竹间智能科技已经走过了两年的时间 。
什么是情感识别?能否拯救智障的机器人
为什么现在的机器人感觉很智障,为什么它们的交流如此生硬机械?
在简仁贤看来,人与人之间的交流是自然的交互,包括图像视觉、声音与文字,都是有情感在的 。而要想达到自然的人机交互,就必须使机器具备情感识别和理解能力 。两年以来,简仁贤将大部分经历放在了情绪情感技术的打磨上 。采访一开始,简仁贤就迫不及待地向网易智能等媒体展示了他们与Google在人脸情绪辨别上的对比测试成绩单,并进行了细致的解说 。
据简仁贤介绍,竹间智能的一家合作伙伴将竹间智能Emoti-Face API与Google cloud vision API的做了对比 。
测试结果显示,竹间智能的人脸情绪API可以辨识9种情绪,包括开心(Happy)、生气(Angry)、哀伤(Sad)、惊讶(Surprise)、害怕(Fear)、反感(Disgust)、轻视(Cotempt)、困惑(Confused)、中性(Neutral) 。但是Google的人脸情绪API只能辨识4种情绪,分别是愤怒(Anger)、喜悦(Joy)、悲痛(Sorrow)、惊讶(Surprise) 。

专访简仁贤:如何用情感交互拯救智障的机器人?AI英雄

文章插图
六张不同人脸情绪的识别测试
注:测试对比采用香港中文大学ExpW数据库作为测试集,测试机里有9万多张人脸 。
在同一个测试集里,竹间智能的人脸识别的准确率是96 。68%,Google是81 。52% 。在人脸表情识别度上,简仁贤介绍,这个维度测试同一张照片场景中不同灯光、角度下的三个人脸情绪,还有六张不同人脸情绪的识别 。最终结果显示,竹间智能的准确率达到了81 。57,Google只有70 。84,前者比后者高出15% 。简仁贤总结说,开心是最好辨认的情绪,在惊讶、哀伤的情绪上竹间智能领先Google的比较多,而生气这个情绪很难辨认 。
与此同时,简仁贤还向网易智能介绍了人脸情绪的识别规律,竹间智能采用的是对表情给一个几率值,比如是0到1分数,哪个分值大就是哪种情绪 。比如第一张脸系统判断其他情绪值都是是0,只有开心值是1,就判断整个情绪是开心的 。而Google的做法是用四个值来衡量,Very Unlikely、Unlikely、Likely、Very Likely,用这个四个值的分数去辨别情绪 。
简仁贤称,竹间智能对于人脸情绪识别的算法,大部分都是原创的,架构训练和速度更快,不管是在CPU还是在GPU上测试,与其他算法相比都是运算时间最少的 。而且运行存储十分小,容易直接做到单机上,甚至低端手机上 。简仁贤对自己的技术充满了信心,“希望竹间智能能将自己的人脸情绪识别技术拿到业界做一个公开的评比 。”