微信截图_20240920153326.jpg
拍不到脸,“人脸识别”也能锁定你
2019-07-30 08:02:00  来源:中国江苏网  
1
听新闻

  中国江苏网讯 今年7月1日开始,南京交警部门启用非机动车、行人交通违法抓拍,即使多人闯红灯过马路,抓拍系统也可以一一识别人脸,挨个发送交通违法短信提示。在此前张学友全国演唱会上,接二连三的有逃犯落网,其中有些是潜藏多年的逃犯,幕后就是人工智能技术的支持。为什么要推广人脸识别?当然不光是为了抓逃犯,“我们是为了一个新的时代,叫做人类和人工智能协作共存的新时代。”人工智能领域专家温浩为您解读,“人脸识别”是如何做到在浩瀚人海中“一眼”就锁定你的。

  转自SELF格致论道讲坛(微信号:SELFtalks),有删节

  主讲嘉宾

  温浩

  中国科学院重庆研究院人工智能联合研究中心副主任,云从科技联合创始人

  人工智能连你是谁都不知道,它怎么和你协作?

  我们为什么要做人脸识别?当然不光是为了抓逃犯,我们是为了一个新的时代,叫做人类和人工智能协作共存的新时代。

  大家可能对人工智能既熟悉又陌生,觉得是不是人工智能要代替人?我们其实是抱积极乐观的态度,它(人工智能)一定是和我们协作共存的。协作一定是从识别人开始的,如果机器连你是谁都不知道那它怎么和你协作?

  我们70%的信息都来自于视觉,所以人脸识别是非常重要的视觉的入口,在各行各业已经得到广泛的应用。比如通过刷脸支付,我们能很方便地买到一杯咖啡,不需要带卡,不需要带其他东西,也不需要记密码。在机场通过安检口识别之后,我们可以走到一个航显屏上,它可以实时地把我要去的目的地、航班、登机口都显示出来,同时可以指示我怎么走到登机口。这就是非常好的展示人工智能帮助我们更好地生活的例子,不光是保障我们的安全。

  我们要达到让机器更靠谱地识别人的目的,第一个就是要解决人脸识别。

  人脸识别的基本原理是通过摄像机拍一张你的照片,然后在后台计算机上分析。照片是有角度、有光线的,如何让计算机摆脱这些干扰因素?如果是侧面和正面,会有怎样的影响?如果是逆光,人脸可能都看不清楚了,这时怎样把它识别出来?这些因素都是我们首先要考虑的。

  1亿次冒充别人去验证,通过的概率只有一次

  从2013年开始,我们做了一些实验性的工作。首先,我们设计了一个大规模的摄像头阵列,这个阵列有91个摄像头,包括7层,我们叫7种俯仰角,以及13个不同偏转角度,我们叫偏航角。这91种角度,91个摄像头,可以在毫秒的误差范围内同时采集到一个人不同角度的人脸,我们称之为结构化的数据。

  它能够让计算机在短时间内通过少量的数据训练,对一个人不同的角度采取有效的分析。这个设备我们现在还在用,采集到上千万张结构化的人脸。

  其次,我们模拟了各种各样的光源,强光、弱光、逆光、顺光,或者是太阳光,或是微弱的星光,或者室外的车灯、室内的照明灯,来看这种光源情况下,不同的光照等级下人脸的变化情况。

  这是从角度和光源两个方面去识别人脸。通过这些技术,我们今天可以把人脸识别的误识率做到亿分之一。相当于1亿次尝试冒充别人去验证,只有一次机会的概率通过,这基本上可以覆盖到绝大多数的应用。我们人眼的正确率大概是97%左右,它已经是99.8%了。

  仅仅靠这个就可以把事情做好了吗?还不行。举个例子,前段时间我们看到宁波有一套行人的闯红灯识别系统,它可以把非法闯红灯的行人实时抓拍并曝光在LED屏上。

  结果有网友看到董明珠女士的照片曝光在曝光台。仔细一看发现原来是公交车上的车身广告。车身广告有董明珠女士的人脸,摄像机把她精确地识别出来了,然后被认为是非法闯红灯了。

  这种情况让人尴尬,识别没有错,但犯了一个最大的问题是这是不是真实的人脸,如果不是真实的人脸就应该排除掉。

  这牵扯到另外一项技术——活体检测技术,它能够分辨是平面的照片,还是视频,还是一个真实的人脸,甚至是一个3D的人脸模型,都可以把它分辨出来,这是我们要做的第二项技术。

  不用拍到脸,通过衣着、仪态等就可以认出你

  最早我们的技术是用在手机银行,或者是证券的远程开户。比如今天很多APP上用刷脸登录,它会让你眨眼、转头或者是张嘴,这些动作是随机的,你不可能事先录制好,通过这些动作就可以判别出你是真人还是照片。

  但大家在使用过程中会发现它比较慢,快的话也要三五秒钟,慢的话可能要十几秒钟,有时可能不太方便。为什么要做这些看起来很傻的动作?所以这就是我们现在要解决的。

  第二代的红外双目技术。它通过两个摄像头,一个是可见光的摄像头,RGB的,还有一个是红外光摄像头,我们虽然人眼看不到,但它对我们的人脸是比较敏感的,它可以反射,可以被红外的摄像头采集到。但如果是照片,或者是视频、平板,它反射回来的照片是不一样的。通过这种差异性的计算可以把真实的人脸和照片区分开。

  像这样的技术,我们已经用在刷脸支付,银行里的刷脸取款。

  但是我们现在的技术还是平面的,最重要的是发展一个三维的、实时的生成人脸,我们采取结构光的技术。

  它同样是红外光,也同样有至少两个摄像头,一个是可见光摄像头,一个是红外光摄像头,但是这个光跟刚才不一样,它是有结构的,比如说二维的点阵。

  假如有一万多个二维点阵,它可以同时投射到人脸上,因为这些光有结构,它经过空间的传输后到人脸,人脸是有深度的,经过反射之后会产生形变,形变信息经过计算以后就可以得到人脸的实时的3D模型。

  这个技术可以精确地实现人脸3D建模,当然就可以分辨出人脸是平面的还是真实的。如通过一张照片就能生成你的人脸模型,侧面、正面、顶部和底部。

  有了这些技术之后,我们基本上可以比较精准地识别到一个人脸。

  但这还远远不够,很多时候摄像机是固定的角度,并不能拍到你的人脸,这时怎么办?

  从2017年开始,我们在做这样一个技术叫跨镜追踪,不同的摄像机可以把同一个人的衣着、姿态、配饰都识别出来,然后仍然把你定位出来。

  这个技术非常实用,如果用在抓逃犯上,可以更精准地通过少量的摄像机能把目标人物检测出来。

  当然它可以用在其他更多地方,假如说一个女孩在公园里跑步,公园主干道上有一些摄像机,这些摄像机在没有拍到人脸的情况下,仍然可以把这个女孩的衣着和步态识别出来,然后对她进行轨迹的跟踪,这就是我们的跨镜追踪技术。

  这个技术除了抓逃以外,还可以用于帮助走失的儿童、走失的老人,可以实时地、快速地跟踪。同时,这个技术还可以用在商业里面。

  精彩观点

  我们为什么要做人脸识别?当然不光是为了抓逃犯,我们是为了一个新的时代,叫做人类和人工智能协作共存的新时代。大家可能对人工智能既熟悉又陌生,觉得是不是人工智能要代替人?我们其实是抱积极乐观的态度,它(人工智能)一定是和我们协作共存的。协作一定是从识别人开始的,如果机器连你是谁都不知道那它怎么和你协作?

  通过这些技术,我们今天可以把人脸识别的误识率做到亿分之一。相当于1亿次尝试冒充别人去验证,只有一次机会的概率通过,这基本上可以覆盖到绝大多数的应用。我们人眼的正确率大概是97%左右,它已经是99.8%了。

标签:人脸;人工智能;格致
责编:孟涛 崔欣
下一篇