yumulog

北海道の大学教員/情報科学研究者の日記

#TokyoWebmining 第23回データマイニング+WEB@東京に参加しました



会場のニフティさん*1の最寄り駅は、西新宿。初めて降りる駅だと思っていたら、なんか前に来たことある感じがした。でも地下鉄の駅なんてどこも似たようなつくりだからデジャヴだろうと思って歩いていたら、見覚えのある不動産屋さんの建物が。7年前に院試のためウィークリーマンション借りた時の不動産屋さんが西新宿にあるんだった!懐かしすぎる!

という感じで(どんな感じだ)、第23回データマイニング+WEB@東京(以下、東京Webマイニング)に参加してきました。勉強会の内容等については、主催の @ さんのblog


にこれ以上ないくらいまとまっているので、そちらを見ていただくとして、ここでは思ってたこととか感じたことを書きます。

参加した目的

研究で、行動データ(←ざっくり)つかった解析とか予測とかをやりたいと思っていて、何からどう始めていいのかわからないので、最近は W8 PRML読書会 に参加しはじめたりしていた。以前から東京Webマイニングの存在自体は知っていて、とても面白そうな勉強会だなーとは思っていたのだが、若干敷居を高く感じてて、今まで申し込めずにいた。でもせっかく興味を持ったのだからこの東京Webマイニングでもいろいろ勉強させて頂こうと思って参加してみました。

あとは、前回(第22回)にて @ さんが発表されていたスライド

が、めちゃくちゃ面白かった。プレゼンテーションのスキルとしてビジュアライゼーションが取り上げられることはあっても、ここまでビジュアライゼーションにフォーカスされた内容は初めてみた。
自分でもあまり意識してなかったけど、データの見せ方にはもともとすごく興味があって、そういえば、修士の研究室を選んでるときや、研究室に入ってからも「磁気リコネクションの3次元ビジュアライゼーションやりたいなあ」とかちょっと思ってたことを思い出した。結局全くやらなかったけど。それで、ああ、こんな面白い発表がされている勉強会にはぜひいかなきゃ!と思ったというのもあった。

あとあと、今回の参加者募集が出たのがたしかこのスライドみた翌日だったのもタイミング良かった。テンション上がってたのでそのまま勢いで申し込んだ。

内容について感想

まず、@hamadakoichi さんを筆頭に、物理出身多すぎワロタw まあ、物理学で専門を生かして就職するのっていろいろ難しい面があるので、データマイニング物理屋さんのひとつの生きる道なんですよね。

@ さんの発表聞いて、ソーシャルグラフ面白い!と思いました。そういえば自分、個人情報とかそういうの好きだったわ。

いろんな面白い発表を聞けて、知識だったり経験だったりがすごい多様で豊富な方々とお話しできて、(ありきたりですけど)すごく刺激を受けました。日々の仕事にかまけて研究のほうが疎かになりがちなのですが、研究の方もちゃんとやってやろう!と火が点きました。
@hamadakoichi さんからなんと発表のムチャぶりもされてしまったので、点いた火にガソリンが投入されてしまった感じですが、研究を加速するいい機会なので、発表は少し先(来年以降)にはなりますが、しっかり準備したいと思います。

データマイニングや統計、機械学習について正直まだまだわかってないところがたくさんありすぎるので、なかなか険しい道にはなりそうなのですが、これだけのことをまとまって勉強する機会ってこれからの人生でそう多くはないと思うので、その機会に恵まれたことを楽しんで、しっかり勉強したいなと思ってます。


参加者のみなさん、ありがとうございました!

運営について感想

もう、ほんとうに素晴らしいと思いました。感動しました。@hamadakoichi さん、 @ さん、ありがとうございました!「セキココ」「おやつ」「TwitterのTL表示」「自己紹介セッション」「ホワイトボードへのキーワード記入」など、勉強会が上手く回るような工夫がきめ細かくされていて、回数を重ねるごとに改善していっているのが本当によくわかりました。各項目がXMind をつかってマインドマップにまとめられているのも素晴らしい。


その中でも特に良かったと感じたのが「ボランティア募集」。参加申し込みフォームに

開催をよりよいものとするために通常より30分早く11時集合で運営ボランティア手伝って頂けないでしょうか? (内容:受付、お菓子買出し、会場設営、等)

とあり、私もお手伝いさせていただきました。

いろんな勉強会に参加させて頂いて感じるのが、いつも恩恵を受けてばかりなのでなにか貢献したい(そして少しでも運営してくださってる方々の負担を減らしたい)、特に人手が必要な作業等はいろいろお手伝いしたい。ただ何をどう手伝えばいいのかわからず結局何もできない、というのがよくあるケース。でもこういう風にボランティアを明示的に募集して、作業を割り当てて頂けると、多少なりとも運営のお役に立てた気がして気持ちよく勉強会に参加することができました。ボランティアさせて頂きありがとうございました!

名札について

この勉強会は基本的にTwitter IDをベースにすすめられているので、名札にもTwitter IDが書かれていると良いかなと思いました。Twitter IDと本人の紐付けが容易にできて、会話しやすくなりそうです。あとは、何回目の参加か等の情報を書いておけば会話のきっかけにもなって良い気がしました。改善策としては、大きめの名札ケース(首下げ?)を用意して、Twitter IDや懇親会参加可否、参加回数等を紙に書いてもらって名刺と一緒に入れておく、でしょうか。反対意見がなければ、次回以降、物品と簡単なフォーマットを用意していこうかなと思います。

Appendix:宣伝

こんなのあります。行動データに興味ある方はぜひ。

HASC Challenge 2012とは


HASC(人間行動センシングコンソーシアム)では、人間行動のセンシングを通じて、行動認識、理解の実現を目指しており、そのための大規模データベースの構築に取り組んでいます。(HASCについてはhttp://hasc.jp/をご覧ください。)


しかし、大規模データベース構築のためには、まだまだ多くの課題があることがわかってきました。そこで、技術チャレンジを通じ、多くの方々の協力を得ながらその実現を目指す、ということを目標に、昨年、一昨年と「HASC Challenge 2010、2011」を開催しました。結果、250名規模の行動データを収集することができ、大規模データベース構築の実現に向けて第一歩を踏み出すことができました。今年は、HASC Challenge 2010, 2011から得た知見をもとに、今後の人間行動センシングについて検討した上で、新たな技術チャレンジ「HASC Challenge 2012」を開催します。


なお、HASC Challenge2012 の参加登録者は、優先的に昨年度の成果である HASC2012corpus が利用できます。 Hub.hasc.jp から HASC Challlege への登録によって、コーパスにアクセスが可能です。また、 HASC2010corpus, HASC2011corpusについても、Hub.hasc.jp からダウンロード可能です。


HASCChallenge2012 では、参加者の協力を通じ、人間行動センシングのためのデータ収集、および特徴量・アルゴリズムの開拓、および、アルゴリズム・ツールの標準化を目指します。

Appendix:本

この会で、いままで全然知らなかった面白そうな本を知ることができて、それもうれしかったです。まず、会の中で何度か話題になっていた

その数学が戦略を決める (文春文庫)

その数学が戦略を決める (文春文庫)


翌日速攻で買いましたw
そして

DSP/RTBオーディエンスターゲティング入門 ビッグデータ時代に実現する「枠」から「人」への広告革命 (Next Publishing)

DSP/RTBオーディエンスターゲティング入門 ビッグデータ時代に実現する「枠」から「人」への広告革命 (Next Publishing)

今年出た新し目の本。この本もまずは本屋さんでパラパラ眺めようと思ったのに、在庫がなくて残念。*2 これも必ずいつか読みます。
あと、懇親会で @ さんにオススメして頂いた本があるのですが、タイトルがうろ覚えで、特定できませんでした(>_<)

プログラミングのための確率統計

プログラミングのための確率統計

Think Stats ―プログラマのための統計入門

Think Stats ―プログラマのための統計入門

のどっちかだと思うのですが。。。

*1:会場のご提供ありがとうございました!

*2:電子書籍orPODのみの本でした