Science 也玩标题党:百分之百精度人脸识别

34 views
Skip to first unread message

pongba

unread,
Oct 6, 2008, 9:56:51 AM10/6/08
to TopLanguage
从北邮的模式识别与人工智能 bbs 上看到这个消息。

1. 先是有人在 science 上灌了一篇 paper ,名字一看能把人吓得一愣:靠,什么时候人脸识别这么难的问题居然能够做到百分之百了,莫非人工智能问题终极问题的解指日可待?可让偶赶上这拨了..
2. 找出来一看,水得很。大失所望,玩标题党,跟上次 MIT 报道的机器能做到和小孩一样对 pattern 进行归类的 paper 一样,其实 MIT 那篇还到底有技术含量多了。这篇百分之百人脸识别的文章的主旨如下(如果我的理解没错的话):首先是网上有一个现成的人脸识别系统,做到了 54%,其工作框架大体是在训练数据库里面对于每个人(如克林顿)存放 9 幅左右不同角度,不同年代拍摄的照片,测试的时候用户提交一副照片,然后算法给出这个照片中人是谁。具体如何识别咱先不管。这篇文章的作者怎么把精度提高到100%的呢?首先他选了一个自己的测试数据库,其中对每个人都有25副不同的照片,然后提交这个测试库给这个系统,算出一个基线精度值。然后扯淡的事情来了,他将同一个人的 N 副不同的照片求一个平均,即合成一副单独的照片(就叫这幅照片为 averaging image 吧),然后将这些合成照提交给系统,事实证明所有合成照都被正确识别出来了,于是他们称"靠,100%识别率!"。
3. 北邮的几位牛人一眼看穿了这是个水贴(事实证明,玩标题党玩到中国人眼中最不明智了,偶们都是百炼成钢不吃这套滴),于是发了一个 Technical Comment ,指出其中的两个潜在问题:1. 合成照的生成过程使用了手动的人脸朝向调节,所有的侧向人脸都被手动调节为正向人脸以便进行合成,也许正是这个手动调节的原因使得图像识别变得容易了。2. 将一个合成照片提交给系统之后,系统也许只将这个照片对应到了训练库中某个人的某张特定照片上,并没有对应到他的所有训练照片上。比如合成的克林顿照片只被对应到了训练库中9副克林顿照片中的那副大选中拍摄的照片,其他照片还是 negative ,所以这不能算 100% ,100% 得是说同一个人的所有照片两两之间都要识别出等价关系来。
4. 然而,看起来几位原作者也不是一般灌水的角色,立即操刀杀过来,有力地驳倒我方第一条意见:事实证明,单单手动调节人脸朝向却会使精确都下降,所以称它是可能导致精度上升的原因是不成立的。此外逻辑上也驳倒了我方的第二段,他们的观点是虽然合成照只被对应到训练库中的某个人的某一副照片,但非合成照的测试中同样如此。
5. 依我看这个事情其实可以这样来反驳:首先这个文章就 barking up the wrong tree (没搞清问题是什么就下手了),现实世界中的人脸识别的问题应当是当遇到一个(而不是多个)图像的时候如何时别,比如你站在10米开外,从侧面看到一个MM,你是不是能看出来她是你女朋友。可这篇文章倒好,把若干副照片(很可能是不同角度不同光照条件下不同距离)给合成起来了,这不相当于我先对一个人左右上下端详好大一番,然后进行识别么?在这个前提下图像识别还有毛难度呢?想想看,我们平常乍一看如果认不出一个人会怎么办?换个角度再端详端详呗!所以说这文章首先就弄错了问题。我们人类很多时候能够仅靠一个侧面,甚至一个轮廓、一双眼睛,一个嘴部就能识别出一个人来,而并不需要把所有的角度的图像都综合起来看。更技术一点说,文章中用到的系统所实现的人脸识别算法肯定有一个特征抽取的过程吧,既然是特征抽取,那么测试图像特征越是丰富全面,正确率越高,你把多个图像合成起来了,相当于把它们的特征全都拉到一副图片中,当然靠谱,当然识别度高啦,因为信息量增加了嘛。
6. 所以说,science 也扯淡。

--
刘未鹏(pongba)
Blog|C++的罗浮宫
http://blog.csdn.net/pongba
TopLanguage
http://groups.google.com/group/pongba
Twitter
http://twitter.com/pongba
Delicious
http://delicious.com/pongba
Douban
http://www.douban.com/people/pongba/

pongba

unread,
Oct 6, 2008, 9:57:52 AM10/6/08
to TopLanguage
忘了给出北邮老师的 Comment 地址了:

http://www.sciencemag.org/cgi/content/abstract/321/5891/912c

2008/10/6 pongba <pon...@gmail.com>

pongba

unread,
Oct 6, 2008, 10:10:52 AM10/6/08
to TopLanguage
BTW. 这里貌似有好些北邮的同学吧,我在北邮 bbs 那里看到对这篇 Comment 的渲染,的确是有些过了,这篇 Comment 并没有技术内容,而是逻辑上的 Argument 。

2008/10/6 pongba <pon...@gmail.com>

hack...@sina.com

unread,
Oct 6, 2008, 11:07:47 AM10/6/08
to TopLanguage
玩文字游戏,
数据是特别挑选过的,
那么就没有意义。

On Oct 6, 6:56 am, pongba <pon...@gmail.com> wrote:
> 从北邮的模式识别与人工智能 bbs 上看到这个消息。
>
> 1. 先是有人在 science 上灌了一篇 paper
> ,名字一看能把人吓得一愣:靠,什么时候人脸识别这么难的问题居然能够做到百分之百了,莫非人工智能问题终极问题的解指日可待?可让偶赶上这拨了..
> 2. 找出来 <http://www.sciencemag.org/cgi/content/abstract/319/5862/435>一看,水得很。大失所望,玩标题党,跟上次
> MIT 报道的机器能做到和小孩一样对 pattern 进行归类的 paper 一样,其实 MIT
> 那篇还到底有技术含量多了。这篇百分之百人脸识别的文章的主旨如下(如果我的理解没错的话):首先是网上有一个现成的人脸识别系统,做到了
> 54%,其工作框架大体是在训练数据库里面对于每个人(如克林顿)存放 9
> 幅左右不同角度,不同年代拍摄的照片,测试的时候用户提交一副照片,然后算法给出这个照片中人是谁。具体如何识别咱先不管。这篇文章的作者怎么把精度提高到10-0%的呢?首先他选了一个自己的测试数据库,其中对每个人都有25副不同的照片,然后提交这个测试库给这个系统,算出一个基线精度值。然后扯淡的事情来了,他将-同一个人的
> N 副不同的照片求一个平均,即合成一副单独的照片(就叫这幅照片为 averaging image
> 吧),然后将这些合成照提交给系统,事实证明所有合成照都被正确识别出来了,于是他们称"靠,100%识别率!"。
> 3. 北邮的几位牛人一眼看穿了这是个水贴(事实证明,玩标题党玩到中国人眼中最不明智了,偶们都是百炼成钢不吃这套滴),于是发了一个 Technical
> Comment ,指出其中的两个潜在问题:1.
> 合成照的生成过程使用了手动的人脸朝向调节,所有的侧向人脸都被手动调节为正向人脸以便进行合成,也许正是这个手动调节的原因使得图像识别变得容易了。2.
> 将一个合成照片提交给系统之后,系统也许只将这个照片对应到了训练库中某个人的某张特定照片上,并没有对应到他的所有训练照片上。比如合成的克林顿照片只被对应-到了训练库中9副克林顿照片中的那副大选中拍摄的照片,其他照片还是
> negative ,所以这不能算 100% ,100% 得是说同一个人的所有照片两两之间都要识别出等价关系来。
> 4. 然而,看起来几位原作者也不是一般灌水的角色,立即操刀杀过来<http://www.sciencemag.org/cgi/content/abstract/321/5891/912d>
> ,有力地驳倒我方第一条意见:事实证明,单单手动调节人脸朝向却会使精确都下降,所以称它是可能导致精度上升的原因是不成立的。此外逻辑上也驳倒了我方的第二段-,他们的观点是虽然合成照只被对应到训练库中的某个人的某一副照片,但非合成照的测试中同样如此。
> 5. 依我看这个事情其实可以这样来反驳:首先这个文章就 barking up the wrong tree
> (没搞清问题是什么就下手了),现实世界中的人脸识别的问题应当是当遇到一个(而不是多个)图像的时候如何时别,比如你站在10米开外,从侧面看到一个MM,你-是不是能看出来她是你女朋友。可这篇文章倒好,把若干副照片(很可能是不同角度不同光照条件下不同距离)给合成起来了,这不相当于我先对一个人左右上下端详好大-一番,然后进行识别么?在这个前提下图像识别还有毛难度呢?想想看,我们平常乍一看如果认不出一个人会怎么办?换个角度再端详端详呗!所以说这文章首先就弄错了-问题。我们人类很多时候能够仅靠一个侧面,甚至一个轮廓、一双眼睛,一个嘴部就能识别出一个人来,而并不需要把所有的角度的图像都综合起来看。更技术一点说,文-章中用到的系统所实现的人脸识别算法肯定有一个特征抽取的过程吧,既然是特征抽取,那么测试图像特征越是丰富全面,正确率越高,你把多个图像合成起来了,相当于-把它们的特征全都拉到一副图片中,当然靠谱,当然识别度高啦,因为信息量增加了嘛。

PtwCJ

unread,
Oct 6, 2008, 11:30:52 AM10/6/08
to TopLanguage
汗,刚才不小心回复作者了,囧.....再重发一遍吧
--------------
那个帖子是一个ID直接复制学校布告栏的内容,官方的东西,大家都了解怎么回事

而且很多本科生不了解comments和paper的区别

原作者还是很牛很低调的

On 10月6日, 下午10时10分, pongba <pon...@gmail.com> wrote:
> BTW. 这里貌似有好些北邮的同学吧,我在北邮 bbs 那里看到对这篇 Comment 的渲染,的确是有些过了,这篇 Comment
> 并没有技术内容,而是逻辑上的 Argument 。
>
> 2008/10/6 pongba <pon...@gmail.com>
>
>
>
>
>
> > 忘了给出北邮老师的 Comment 地址了:
>
> >http://www.sciencemag.org/cgi/content/abstract/321/5891/912c
>
> > 2008/10/6 pongba <pon...@gmail.com>
>
> > 从北邮的模式识别与人工智能 bbs 上看到这个消息。
>
> >> 1. 先是有人在 science 上灌了一篇 paper
> >> ,名字一看能把人吓得一愣:靠,什么时候人脸识别这么难的问题居然能够做到百分之百了,莫非人工智能问题终极问题的解指日可待?可让偶赶上这拨了..
> >> 2. 找出来 <http://www.sciencemag.org/cgi/content/abstract/319/5862/435>一看,水得很。大失所望,玩标题党,跟上次
> >> MIT 报道的机器能做到和小孩一样对 pattern 进行归类的 paper 一样,其实 MIT
> >> 那篇还到底有技术含量多了。这篇百分之百人脸识别的文章的主旨如下(如果我的理解没错的话):首先是网上有一个现成的人脸识别系统,做到了
> >> 54%,其工作框架大体是在训练数据库里面对于每个人(如克林顿)存放 9
> >> 幅左右不同角度,不同年代拍摄的照片,测试的时候用户提交一副照片,然后算法给出这个照片中人是谁。具体如何识别咱先不管。这篇文章的作者怎么把精度提高到10-0%的呢?首先他选了一个自己的测试数据库,其中对每个人都有25副不同的照片,然后提交这个测试库给这个系统,算出一个基线精度值。然后扯淡的事情来了,他将-同一个人的
> >> N 副不同的照片求一个平均,即合成一副单独的照片(就叫这幅照片为 averaging image
> >> 吧),然后将这些合成照提交给系统,事实证明所有合成照都被正确识别出来了,于是他们称"靠,100%识别率!"。
> >> 3. 北邮的几位牛人一眼看穿了这是个水贴(事实证明,玩标题党玩到中国人眼中最不明智了,偶们都是百炼成钢不吃这套滴),于是发了一个 Technical
> >> Comment ,指出其中的两个潜在问题:1.
> >> 合成照的生成过程使用了手动的人脸朝向调节,所有的侧向人脸都被手动调节为正向人脸以便进行合成,也许正是这个手动调节的原因使得图像识别变得容易了。2.
> >> 将一个合成照片提交给系统之后,系统也许只将这个照片对应到了训练库中某个人的某张特定照片上,并没有对应到他的所有训练照片上。比如合成的克林顿照片只被对应-到了训练库中9副克林顿照片中的那副大选中拍摄的照片,其他照片还是
> >> negative ,所以这不能算 100% ,100% 得是说同一个人的所有照片两两之间都要识别出等价关系来。
> >> 4. 然而,看起来几位原作者也不是一般灌水的角色,立即操刀杀过来<http://www.sciencemag.org/cgi/content/abstract/321/5891/912d>
> >> ,有力地驳倒我方第一条意见:事实证明,单单手动调节人脸朝向却会使精确都下降,所以称它是可能导致精度上升的原因是不成立的。此外逻辑上也驳倒了我方的第二段-,他们的观点是虽然合成照只被对应到训练库中的某个人的某一副照片,但非合成照的测试中同样如此。
> >> 5. 依我看这个事情其实可以这样来反驳:首先这个文章就 barking up the wrong tree
> >> (没搞清问题是什么就下手了),现实世界中的人脸识别的问题应当是当遇到一个(而不是多个)图像的时候如何时别,比如你站在10米开外,从侧面看到一个MM,你-是不是能看出来她是你女朋友。可这篇文章倒好,把若干副照片(很可能是不同角度不同光照条件下不同距离)给合成起来了,这不相当于我先对一个人左右上下端详好大-一番,然后进行识别么?在这个前提下图像识别还有毛难度呢?想想看,我们平常乍一看如果认不出一个人会怎么办?换个角度再端详端详呗!所以说这文章首先就弄错了-问题。我们人类很多时候能够仅靠一个侧面,甚至一个轮廓、一双眼睛,一个嘴部就能识别出一个人来,而并不需要把所有的角度的图像都综合起来看。更技术一点说,文-章中用到的系统所实现的人脸识别算法肯定有一个特征抽取的过程吧,既然是特征抽取,那么测试图像特征越是丰富全面,正确率越高,你把多个图像合成起来了,相当于-把它们的特征全都拉到一副图片中,当然靠谱,当然识别度高啦,因为信息量增加了嘛。
> >> 6. 所以说,science 也扯淡。
>
> --
> 刘未鹏(pongba)
> Blog|C++的罗浮宫http://blog.csdn.net/pongba
> TopLanguagehttp://groups.google.com/group/pongba
> Twitterhttp://twitter.com/pongba
> Delicioushttp://delicious.com/pongba
> Doubanhttp://www.douban.com/people/pongba/- 隐藏被引用文字 -
>
> - 显示引用的文字 -

Pattern

unread,
Oct 6, 2008, 11:54:12 AM10/6/08
to pon...@googlegroups.com
这个在水木社区上被批驳过

2008/10/6 pongba <pon...@gmail.com>

Du Lei

unread,
Oct 7, 2008, 5:16:46 AM10/7/08
to pon...@googlegroups.com
就是我们实验室的师兄,和我的导师发的comment。

那个稿子应该是校方的文学青年或是文艺女青年写的,出来了我们实验室的人也哭笑不得。

都"显示我校学生攀登科学高峰的勇气了"……

Yang Xiao

unread,
Oct 7, 2008, 5:19:10 AM10/7/08
to pon...@googlegroups.com

, 拜读过.. 第一次在北邮人上看到, 后来转载到水木, 雷人效果相当之好

 


gleery

unread,
Oct 9, 2008, 2:26:50 AM10/9/08
to TopLanguage
看了一遍那篇文章,我觉得作者得到的结论并不奇怪,对于一幅照片来说,存在可以正确识别的人脸信息和由于外部条件的干扰而不容易识别的部分。如果将多个
这样的照片合成,正确的部分会有更大的概率被选出到合成的结果中。所以将结果的图片再去识别时,能够找到匹配就更有可能了。

不过在实际中,我们识别的目的显然不是识别合成图片,而是实际中的任意图片,所以不知道这里说合成图片能够被100%识别有什么意义。如果合成图片可以
匹配任意图片,我们就可以用合成图片做蓝本,来识别任意图片了,可以很明显这不可能。实际上与其使用合成图片还不如给每个人拍一副登记照,效果应该也是
100%吧。

一个科学家是不会这么草率的用100%这种字眼的,说他们忽悠的确没错。

On Oct 6, 9:56 pm, pongba <pon...@gmail.com> wrote:
> 从北邮的模式识别与人工智能 bbs 上看到这个消息。
>
> 1. 先是有人在 science 上灌了一篇 paper
> ,名字一看能把人吓得一愣:靠,什么时候人脸识别这么难的问题居然能够做到百分之百了,莫非人工智能问题终极问题的解指日可待?可让偶赶上这拨了..
> 2. 找出来 <http://www.sciencemag.org/cgi/content/abstract/319/5862/435>一看,水得很。大失所望,玩标题党,跟上次
> MIT 报道的机器能做到和小孩一样对 pattern 进行归类的 paper 一样,其实 MIT
> 那篇还到底有技术含量多了。这篇百分之百人脸识别的文章的主旨如下(如果我的理解没错的话):首先是网上有一个现成的人脸识别系统,做到了
> 54%,其工作框架大体是在训练数据库里面对于每个人(如克林顿)存放 9
> 幅左右不同角度,不同年代拍摄的照片,测试的时候用户提交一副照片,然后算法给出这个照片中人是谁。具体如何识别咱先不管。这篇文章的作者怎么把精度提高到10 0%的呢?首先他选了一个自己的测试数据库,其中对每个人都有25副不同的照片,然后提交这个测试库给这个系统,算出一个基线精度值。然后扯淡的事情来了,他将 同一个人的
> N 副不同的照片求一个平均,即合成一副单独的照片(就叫这幅照片为 averaging image
> 吧),然后将这些合成照提交给系统,事实证明所有合成照都被正确识别出来了,于是他们称"靠,100%识别率!"。
> 3. 北邮的几位牛人一眼看穿了这是个水贴(事实证明,玩标题党玩到中国人眼中最不明智了,偶们都是百炼成钢不吃这套滴),于是发了一个 Technical
> Comment ,指出其中的两个潜在问题:1.
> 合成照的生成过程使用了手动的人脸朝向调节,所有的侧向人脸都被手动调节为正向人脸以便进行合成,也许正是这个手动调节的原因使得图像识别变得容易了。2.
> 将一个合成照片提交给系统之后,系统也许只将这个照片对应到了训练库中某个人的某张特定照片上,并没有对应到他的所有训练照片上。比如合成的克林顿照片只被对应 到了训练库中9副克林顿照片中的那副大选中拍摄的照片,其他照片还是
> negative ,所以这不能算 100% ,100% 得是说同一个人的所有照片两两之间都要识别出等价关系来。
> 4. 然而,看起来几位原作者也不是一般灌水的角色,立即操刀杀过来<http://www.sciencemag.org/cgi/content/abstract/321/5891/912d>
> ,有力地驳倒我方第一条意见:事实证明,单单手动调节人脸朝向却会使精确都下降,所以称它是可能导致精度上升的原因是不成立的。此外逻辑上也驳倒了我方的第二段 ,他们的观点是虽然合成照只被对应到训练库中的某个人的某一副照片,但非合成照的测试中同样如此。
> 5. 依我看这个事情其实可以这样来反驳:首先这个文章就 barking up the wrong tree
> (没搞清问题是什么就下手了),现实世界中的人脸识别的问题应当是当遇到一个(而不是多个)图像的时候如何时别,比如你站在10米开外,从侧面看到一个MM,你 是不是能看出来她是你女朋友。可这篇文章倒好,把若干副照片(很可能是不同角度不同光照条件下不同距离)给合成起来了,这不相当于我先对一个人左右上下端详好大 一番,然后进行识别么?在这个前提下图像识别还有毛难度呢?想想看,我们平常乍一看如果认不出一个人会怎么办?换个角度再端详端详呗!所以说这文章首先就弄错了 问题。我们人类很多时候能够仅靠一个侧面,甚至一个轮廓、一双眼睛,一个嘴部就能识别出一个人来,而并不需要把所有的角度的图像都综合起来看。更技术一点说,文 章中用到的系统所实现的人脸识别算法肯定有一个特征抽取的过程吧,既然是特征抽取,那么测试图像特征越是丰富全面,正确率越高,你把多个图像合成起来了,相当于 把它们的特征全都拉到一副图片中,当然靠谱,当然识别度高啦,因为信息量增加了嘛。
> 6. 所以说,science 也扯淡。
>
> --
> 刘未鹏(pongba)
Reply all
Reply to author
Forward
0 new messages