分享
Scan me 分享到微信

【新领域】和人脸识别技术来一次亲密接触

Face++人脸识别技术通过融合机器视觉、机器学习、大数据挖掘及3D图形学技术展现给广大开发者和用户。这样的技术或可以为地理信息行业在特定的业务中提供必要支持。

  2012年11月下旬,北京旷视科技有限公司在国内知名创新型成长企业投融资选拔赛事“黑马大赛”中折桂。时年仅25岁的清华大学研三学生、同时也是公司联合创始人之一的唐文斌代表了团队对他们所研发的人脸识别技术平台“Face++”发表了获奖感言。在谈到这项技术的发展前景时,他坦诚表示当前的困境:人脸识别科技即使在已经掌握了核心技术的前提下,也会比较难普及。

泰伯网
北京旷视科技有限公司产品经理 刘晓刚

  的确,如何让人们清楚地了解人脸识别技术,并使这项技术有效地服务于需要它的新领域,正是难点之所在。所以,留给我们的问题是:Face++人脸识别技术平台到底具有什么样的特色?他们又将如何推广自己的技术?人脸识别又与地理信息行业有哪些结合的契机?通过旷视科技团队的产品经理刘晓刚系统而详尽地介绍这项技术及公司的主要发展战略后,一些核心的问题也逐渐明晰。

  开放的互联网战略

  刘晓刚表示,与国内市场中另一些主流的人脸识别技术提供商相比,旷视科技最大的不同就在于他们从一开始就把自己定位成一家互联网公司。为了便于地理信息行业人群的理解,他举例说:“就如同你们熟悉的高德公司那样,我们也不会考虑把自己塑造成一家传统的技术型公司,我们的客户将面向互联网、移动互联网甚至车联网等等。”

  这意味着,旷视科技要以一种开放的心态,舍弃原本已足够自己吃饱的美味蛋糕,来换得一场能与市场中众多合作伙伴一起分享的饕餮盛宴。如今来看,相对于高德公司的发展史,旷视科技的开放战略实施得的确要更早,更彻底,而且更主动。

  在去年10月17日之前,Face++平台允许广大的开发者们在规定的调用量之下免费使用API,但在超过配额后开发者必须支付相应的费用。Face++平台的服务器在国内架设于阿里云,在海外则另将服务器架设在亚马逊公司的云服务中,这两大输出端口都需要旷视科技公司支付日常使用费用。

  但很快,团队发现他们向开发者收费并不利于人脸识别技术的推广,而且同为创业公司,他们也最能理解创业初期遭遇的盈利难困局。因此团队最终决定对公司服务模式进行一次重大调整。这次调整最大的改变便是不再限制开发者对人脸识别技术API的调用请求,而免费也标志着旷视科技正式完成向互联网公司的完全过渡。虽然从此公司要承担起更多的运维成本,但刘晓刚强调,他们的付出是绝对值得的。

  截至目前,Face++平台已经收到超过两万名开发者的调用请求,API累计调用次数则超过了2亿次。这其中不乏一些知名产品和他们建立紧密的合作关系,譬如奇虎360搜索界面中的“识别美女”功能,美图秀秀和美颜相机的人脸器官定位功能,还有世纪佳缘根据审美标准寻找近似的伴侣功能,都是基于Face++人脸识别技术开发出来的。团队预期,越来越多基于人脸识别技术的创新应用还会不断显现。刘晓刚认为,这正是联合创始人唐文斌和他们都希望看到的结果。

  不断成长的识别技术

  据刘晓刚介绍,在学术界针对人脸识别技术原理的不同,也分为了不同的流派。比如有人专门研究面部表情的高层语义信息,通过探讨面部器官比例的综合值形成一套人脸识别的算法;还有一些企业采用的是软硬件结合的方法,通过红外光线辅助扫描人脸的特征来进行识别。

  与上面这些技术不同的是,Face++团队采用的是大数据和深度学习的算法。一方面,识别程序在扫描人脸后会自动描述人们面部器官的的特征,比如眼睛是大是小,眉毛是柳叶的还是平直的,对于不同的人,识别程序都会有不同的描述和记录。

泰伯网
Face++通过不断学习可以搞清楚哪一类“瓜子脸、大眼睛”的人,更受大家欢迎

  另一方面通过开放平台也会积累更多的人物面部数据,形成更多的特征信息。比如随着婚恋网站男女双方提交的个人偏好的增多,系统就能愈发清楚到底哪一类“瓜子脸、大眼睛”的人,更受大家的欢迎;美颜相机就能知道如何为“国字脸、小眼睛”的人提供美容方案。

  目前,团队已从人的面目特征中总结出了83个基准点,它们涵盖了脸部轮廓、嘴巴、鼻子、眼睛等细节,程序基于这些点位的差异化排布确定出对一个人面部特征的准确描述。刘晓刚表示,这些基准点也将会随着Face++平台收集到更多的数据而增加。

  基于这些技术特点,Face++可以实现对不同性别、不同年龄阶段,以及丰富面部动作的识别和判断。有意思的是,对于那些通过刻意化浓妆或整容以掩盖真实年龄或性别的人,系统识别的结果会比较迎合大众的主观判断,即60岁的人如果整成了看起来更像30或40岁的样子,那么程序自然也会这么认为。对此刘晓刚做出了解释:正是因为Face++是利用描述性方法对人脸进行识别,所以面貌上的故意改变肯定会形成一定的误差。如果要准确测定人的年龄,那就需要更加科学的方法了。

  所以刘晓刚强调,Face++人脸识别技术的重点并不是要对一个人的相貌刨根问底,而是依托于大数据提升人脸识别技术精度,并更准确地记录每一个人的特征,从而为开辟更大的技术应用空间铺好一条路。

  市场推广的三条路线

  在早期推广阶段,旷视科技团队积极通过大众化的渠道扮演着视频识别技术“布道者”的角色。例如早先他们曾独立开发过一款十分有趣的体感App游戏《Crows Coming》,通过玩家晃动自己的头部来控制一个稻草人阻挡天空中乌鸦偷盗农作物的行为;随后,他们又与国内一家知名的游戏厂商合作开发了另一款中文体感游戏《街头速滑》。

  刘晓刚提到,开发这两款游戏的初衷是在于让感兴趣的人特别是开发者群体关注他们的技术,他们希望抛砖引玉来吸引他们创造更有趣味和意义的产品,同时,团队本身也会积极开发一些具有商业价值的产品来拓展B级市场。

  所以,旷视科技现在确立的发展思路是通过B2C渠道推广技术的认知度,靠B2D渠道(Developers)鼓励技术创新应用,而在B2B渠道中则是以收费的形式提供服务,从手机、电视等终端厂商,到企业及政府部门单位,以及更多新商业领域的拓展,都将是他们主攻的市场方向。

  刘晓刚透露,团队去年在收入方面已经取得了不错的成绩,公司通过企业间的合作已实现了收支平衡甚至是微盈利;最近,他们开始为今年的发展制定出新的目标,即实现盈利的规模化。

  在地信行业的应用前景

  地理信息技术与视频识别技术的结合由来已久。在GIS行业应用领域,通过视频识别传回来的信息,方便地录入到GIS当中,除了基本的储存和调取信息外,视频识别的信息还可以通过GIS的方法实现数据的处理和分析,比如在交通执法领域中涉嫌违章或违法的车辆,通过道路上每一台可以进行视频识别的摄像头对该车的扫描与记录,就能准确在GIS中呈现出运动的轨迹,并通过GIS中的分析工具预测车辆接下来可能要行驶的方向。

  基于Face++人脸识别技术,同样会在地理信息行业有着广阔应用空间。但对于和地理信息行业的对接,刘晓刚坦言他们目前接触的还并不是很多,但在安保、物流、员工管理、商业服务等可以和位置建立关系的场景中,人脸识别技术都能尽其所长,与导航定位技术天然相融。他还强调,人脸识别技术会把时间、地点等属性连结到一起,形成了“时-空-人”的有机体,譬如它们会在客观上解决诸如室内导航及O2O服务中和商家对接的关键一步,这种聚合产生出的效益将是无穷尽的。

泰伯网
未来,我们还可以基于人脸识别做出更多具有商业价值的应用

  刘晓刚总结说,未来团队会在更多的新领域不断深入挖掘,地理信息行业将是他们重点关注的方向。“一方面,我们十分期待有开发者能够创造出和地理位置信息融合更紧密的杀手级产品,让人脸识别技术走得更远;另一方面,团队也非常愿意和更多的地理位置厂商接触,共同参与到专业领域的功能开发。”(文丨本刊编辑 陈启临)

本文由3sNews.Net原创发表,转载请保留出处:http://news.3snews.net/2014/0318/29417.html

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐

泰伯APP
感受不一样的阅读体验
立即打开