2009/06/30

T-PRIMAL 19th

I attended the 19th T-PRIMAL seminar.

Dr. Shinichi Nakajima from Nikon talked about image recognition and Visual Object Classes Challenge which is an yearly contest including image classification, detection, and segmentation on flickr images. The most interesting point is that the output of image classifiers can be used in the more-primitive task, image detection, though image classification should be harder than image detection in nature. "There must be a sheep in this image, but where?"

In the same way, I suppose we might get something wrong by converting a primal problem A into another problem B, which looks easier, but is actually more difficult. In terms of computational complexity, it is easy to turn a problem into a harder alternative. In this case, we should not give up trying to solve the problem A even if we could not solve the problem B at all.

In addition, we may be able to solve B by using the result of solving A as well as for image detection.

T-PRIMALのセミナーに行ってきました。19回目。

ニコンの中島さんが画像認識のコンテスト、VOC Challengeについて講演。flickrから集めた画像に含まれる20種類の物体(牛とか飛行機とか)のタグ付け(Classification)や、物体の範囲検出(Detection)ピクセル毎の分類(Segmentation)などがタスク。面白かったのは、VOC2008でClassificationの予測出力をDetectionに利用したチームが勝った点。人間の脳みそを考えると、物体の範囲を捉えることのほうが、それが何の物体かを認識するのより時系列的に前にくるし簡単なはずなのに、機械にやらせると難易度が逆転するから逆方向に使える、という。「この写真には羊がいるっぽい。さて、どの辺かな?」って。

そこからの連想で、何らかの問題Aを別の問題Bに帰着するときに、過ちを犯してることってないだろうかと思った。Bの方が簡単そうに見えて、実は難しいという。計算複雑性の話で言えば、簡単な問題をより難しい問題に帰着することは容易なわけで。実世界でそれをやってしまって、Bが解けないからAも諦めているとしたらそれは間違いである、と。AもBも解いて意味がある問題なら、まずAを解いてBに使う、ということもできるかもしれないんだし。

その他にもいろんな人に久しぶりに会って近況を教えあったり、議論したり。こういう凄い人たちと定期的に集まれるって本当に恵まれてるよなぁ。

0 件のコメント: