2009/07/15

Researcher in exhibition

I will go to Yokohama the AT International 2009 which is a popular Japanese automotive event tomorrow.

Of course, I'm not an automotive guy. A support docent at my company's booth is my duty for introducing our failure detection technologies. Do you think this is researcher's work? Yes, every novel and worth to try "real-world" problem should be found in the real-world, not on the web.

明日は横浜のAT International 2009という車イベントに行ってきます。スーツ着て。

もちろん車業界の人間ではないので、やることは会社のブースで我々の故障解析技術の説明のお手伝い。それが研究員の仕事なのか、って?いやいや、新しくて価値ある"real-world"な問題は"real-world"で見つかるんですよきっと。Webに転がってるんじゃなくて。

さぁパシフィコ横浜で、僕と握手!(せんでいい

2009/07/03

PAKDD2009 report

I went to Bangkok, Thailand for the 13th Pacific-Asia Conference on Knowledge Discovery from Database (PAKDD2009) at the end of April.

It is the most popular KDD conference in asian countries. Japanese researchers are the third most population in both submission and attendence.

The best paper is ``Clustering with Lower Bound on Similarity" by M.A.Hasan et al. which addresses how to choose the cluster centers efficiently in neighborhood-graph-based clustering. I saw some text analysis problems which are unique to Chinise or Thailand documents. The invited talk ``KDD for Body sensor network (BSN)" by Prof. Guang-Zhong Yang was very interesting for me. Time-series data from body-attached sensors can be now used for medial purposes with support of KDD methodologies.

I presented a work ``Trace Mining from Distributed Assembly Databases for Causal Analysis" (link) related to traceability issues on safty recalls in manufacturing industry. The proposed mining algorithm aims to efficiently does search among physically-distributed manufacturing databases in a depth-first manner with pruning.

Right before the conference, there were some political conflicts and the state-of-emergency had remained in Bangkok. However, once I entered the city, I didn't see anything dangerous or unpleased at all except high humidity. In addition, there is also swine flu issue for the attendees. Some presentations were cancelled or replaced with automatic ones with recorded voice. Even in such difficult situation, the conference has been successful. I was impressed that student staffs are very kind and helpful. In fact, it was truly the land of smile. I would like to appreciate the conference organizers.

Next year, PAKDD2010 will go to Hyderabad, India. The web site looks still under construction.


アジア系KDD会議のPAKDD2009のためにタイのバンコクに行ってきた。

ベストペーパーはM.A.Hasanらの``Clustering with Lower Bound on Similarity"で、近傍グラフを使ったクラスタリング(クラスタ数kの代わりに類似度の下限を与えてグラフを作る)でクラスタ中心をどうやって効率的に選ぶかという話。テキストの話で、タイ語特有の問題があって面白かった。タイ語も単語間に空白が無いうえ、漢字もないので、全部ひらがなで書いてあるようなもので、外来語など目新しい意味的な区切りを見つけるのが難しい、など。招待講演の``KDD for Body sensor network"は、アプリケーションの話として非常に興味ぶかかった。体に着けたセンサーからの時系列情報に分類やクラスタリングなどKDD的な手法を適用することで、怪我などの異常状態を見つけたりする話をやってるらしい。今は片耳にかける3軸加速度センサーをメインにしてるようだけど、今後センサーはもっと増えるはずだと。

自分は以前やった製造業のリコールでどう原因部品を絞り込んで効率化するかという問題をマイニングに帰着させた``Trace Mining from Distributed Assembly Databases for Causal Analysis"をプレゼン(link) 。物理的に散らばってる組み立てデータベース間をうまく枝刈りしながら深さ優先でたどっていく。やっと世の中に出せたということで、一安心。

ちょうどこの会議の前に政治的な揉め事はあるわ、新型インフルが起きるわで、運営は本当に大変だったはず。参加者のキャンセルもあって、No-showになったり本人不在のまま音声付き自動プレゼンが会場に流れたりしてた。でもバンコク自体は平和そのものだったし、学生スタッフもすごく親切で感動。まさに微笑みの国そのもの。感謝感謝。

来年はインドのハイデラバードで開催。サイトはまだ建設中のようだけどおそらく10月ごろに投稿〆切。

2009/07/02

The beginning

I'm Shohei Hido at IBM Research Tokyo.

Finally I decided to start blogging mainly on my research around machine learning and data mining, both in English and Japanese. First I will add posts about the past events. See how it goes.

Note that there is nothing related to the businesses of my company.

比戸将平です。IBMの東京基礎研究所にいます。

機械学習やデータマイニングの研究についてここで書いてみることにしました。とりあえず英語と日本語併記で、様子を見ながらやっていこうかと。まずはここ最近のことについて振り返って書きます。

もちろんここに書いてあることは会社のことには一切無関係ということで。あしからず。