2017年3月7日から10日までノルウェー・オスロで開催された情報検索・インタラクション系の国際会議 The ACM SIGIR Conference on Human Information Interaction & Retrieval 2017 (CHIIR2017; 「ちあー」と読む)にポスター発表者として参加した。
▲ Chair氏「プログラム表紙の会議名が間違っていることになぜ誰も気づかなかったのか!」
採択された僕の論文は以下:
相変わらずテーマは情報推薦だけど、今回は部分空間法や行列スケッチがキーワードになる。
部分空間法を用いてユーザ・アイテムを表現した特徴ベクトルをフィルタリングする、というのが基本的なアイディアで、似たような手法は異常検知の分野で多く見られる。しかし情報推薦の文脈ではこの手のアプローチはあまり研究されていなかった。
部分空間(観測したベクトル列の基底)は特異値分解によって得られる。そして、この基底をオンラインなアルゴリズムで効率的に更新するために行列スケッチを使う。
このテーマ設定は、2年前にPFNの比戸さんのブログ記事を読んでから行列スケッチに興味が出て、なんとか応用研究に繋げられないかと考えた結果でもある。また、異常検知と情報推薦の接点という意味ではTreasure Dataインターンの経験が助けになった。
▲ ポスターセッションでは発表者含め、みんなビール片手に議論していて楽しかった。
世界観
情報推薦 (recommender systems) はもともと情報検索 (information retrieval) から派生した分野なので、小さな会議だけど採択されたときはとても嬉しかったし、他の発表もかなり楽しみだった。しかし蓋を開けてみると "interaction" の色が強すぎて、全く違う分野の会議に来てしまった感じだった。
https://twitter.com/takuti/status/839460132950011908
「僕はもっと情報検索の理論的 (theoretical) な話を期待していたんだけど…」と漏らすと「あ〜ということは心理学とかに興味があるんだね?」と返ってくる、そんな世界。
しかしまぁこれはこれで新鮮だった。たとえばLibrary Scienceって国内だと筑波大の図書館情報くらいしか思い浮かばないけど、実際は世界中にたくさん研究者がいて勢いのある分野だということを知った。そんな人たちの世界に触れて、ポスターセッションで議論ができたのは貴重な経験。
CHIIR2017ではRecSys2016のPast, Present, Future Paperと似たような趣旨のPerspective Paperが別枠で募集・採択されていた。心理学、社会学、図書館情報学、コンピュータサイエンスなど、多くの分野が交わりつつある情報検索の世界、今がターニングポイントなのかな。SIGIR2018からは分野別(トラックごと)に論文募集が行われるという話もあるし。
https://twitter.com/takuti/status/839403781838225408
なお日本からの参加者は他に5,6名ほどいて、マイナーな小規模会議だと思っていた僕はとても驚きました。
▲ Welcome Receptionはノーベル平和賞授与式の会場でもあるオスロ市庁舎で行われ、オスロ市長が直々に歓迎のスピーチをしてくれた。ヒトと情報の関わり方に関する研究の大切さを、専門家たちも笑っちゃうくらい詳細に語っていてすごかった。
以下参加したセッションのメモ。
Tutorial 1: Interactive Search in Video & Lifelogging Repositories
Part I: Video Search
- 情報検索の分野でこれまでやられてきたことと現実の間にはギャップがある
- たとえば『クエリでキーワードやテキストを指定する』といってもユーザがそんなに明確なイメージを検索前に持っているわけではない
- 『スケッチを描かせてそれで画像検索』といっても、ユーザはアーティストじゃない
- それも踏まえて動画検索という問題を考えると、これからは flexible interactive search を目指すべき
- =ハイブリッドな方法
- システムは複数の検索手段を用意しておいて、ユーザがそれをインタラクティブに適宜選択できるようにしたい
- アプローチ1: ユーザが探索的に探しやすい動画ブラウザ・ナビゲーションの設計
- 例: ZoomSlider
- 動画の上部をスライド or 下部をスライドでシークの粒度が変わる
- 動画内の目的のシーンが近くなったら細かい粒度で探すことができて、
- 遠いときは荒い留度でスキップしながら探すことができる
- いかにユーザの探索的な動画視聴体験を支援するか、がポイント
- どんな粒度(e.g., 時間/画像)で、
- どんな情報(e.g., 色、類似度、動きベクトル、隣接フレーム)を、
- どのようなインタフェースで提示するか
- 例: ZoomSlider
- どれだけ早く探している情報にたどり着けるか、が重要
- 良いインタフェースならユーザはいち早く結果にたどり着ける
- アプローチ2: Region-of-Interest (ROI) サーチ
- 検索対象を動画内のある興味領域のみに限定する
- e.g., サッカー中継動画で、スコアが表示されているエリアに限定して検索すれば得点シーンが割り出しやすい
- アプローチ3: サムネの可視化
- 時間軸、話題の移り変わりをいかにサムネイルという画像列で表現するか
- 3Dで表現したり
何気なく使っている動画再生画面も多くの研究の積み重ねの上に成り立っているんだなーと思うと、先人に感謝しようという気持ちになる。
Part II: Lifelogging
- ライフログ検索の難しさ: たくさんのセンサから集められたヘテロな情報からいかに検索するか
- ウェアラブル機器の発展によって、いろいろなログをアグリゲーションするサービスが増えた (e.g., exist.io)
- Visual Lifelogging (画像によるライフログ)も増えてる
- たとえば食事の写真を撮る行為
- ちなみに食事の画像からカロリーを推定するのは今最もチャレンジングなタスクのひとつ
- 画像で記録すると、データが多くなりすぎて探すのが大変
- 大量のライフログ画像をイベントごとにアノテーション&セグメント化する、といった研究がある
- 究極的にはその情報を使って1日を”要約”したい
- たとえば食事の写真を撮る行為
- この分野の代表的なプロジェクトに Microsoft Research の MyLifeBits というプロジェクトがある
(このパートはひたすらライフログサービスの紹介を聞かされた感じで、正直微妙だった)
個人的にはセンサデータの解析という文脈でデータストリームについて話してほしかったけど、Open Questionとしてサラッと流されてしまった。残念。
ちなみに発表者の方はNTCIRのLifelogタスクの主催者のひとりなので、その宣伝もあった。
Keynote 1: Modeling interactive information retrieval as a stochastic process
https://twitter.com/takuti/status/839462163760693249
- 従来: Mean Average PrecisionなどをMetricとして用いる情報検索
- 「ユーザがドキュメントをひとつひとつ順番に見たとき」という状況を仮定している
- ユーザの行動の事前分布に一様分布を仮定しているようなもので、非現実的
- より現実的なのはランキングを考慮した予測モデルの構築
- 上位のドキュメントに大きな重みを与える
- たとえばNDCGなんかをMetricにすると、これになる
- 情報検索、そしてインタラクティブ情報検索はユーザのSequential Decision Makingを適切にモデリングする必要がある
- Google検索を例に取ると、
- サジェストされた検索ワードの選択
- 検索結果のタイプ(All, Movie, Image, ...)の選択
- 検索結果一覧からの選択...
- これらはすべてranked listからのsequentialなdecision makingと言える
- ユーザはランキング形式で提示される結果からの選択行動を連鎖的に繰り返している
- いかにしてそのようなユーザのサーチパスを推定するか、という問題でマルコフモデルを考える
- 従来の直線的なユーザ行動ではない、より複雑な意思決定プロセスのモデリング
- Expected Gainの最大化によって推定を行うモデルとして The card model というものがある
- Google検索を例に取ると、
終盤には、書籍検索アプリのUIコンポーネント間の遷移確率をEye Trackingの結果を使ってモデリングしたという独自の実験結果が紹介された。しかし、そのモデルがどの程度現実に即しているのか謎だった。そもそもこのアプリのUIは実験のために作られたものだし…。
と思っていたら、会場から「タイポグラフィや色などのUIデザインによってユーザの行動は変わるよね。それも踏まえて、あなたの実験結果を元に、具体的にUIデザイナーは何ができるのか教えて?」といった趣旨の質問が挙がった。それに対する回答は「自分はもっとFunctionalな部分をみているので、ガワのデザインはまた別の研究になっちゃうね」と。うーん…そんなもんかねぇ…。
Keynote 3: CSS and user-adapted web presentation
https://twitter.com/takuti/status/840118237819883520
会議4日間で一番よかったコンテンツは間違いなくこのKeynote。特別目新しい話はなかったけど、ユーモア満載でショーとして素直に楽しかった。
- Webの歴史から話は始まって、ブラウザが背景色(グレー)や文字色を勝手に決めてしまっていて辛かった時代を振り返る
- そして人々(広告主)はきれいなページにするために、画像でいろいろなコンテンツを作成・公開するようになった
- そんな時代に、やっぱりきれいな見た目、美しさは大切だよね、という思いでWeb上のドキュメントの表現手法として提案したのがCSS
- メディアや目的に応じたuser-adaptableな、シンプルな表現手法を提供する
- それまでブラウザで見る背景色はずっとグレーだったので
background: #...
とかCSSで書いた日にはそれはもうみんなテンション上がった - Google検索はスタイルをindexingしないけど、人間は見ればその違いがわかる
- Semanticsから分離された表現、これが大事
- Web font は良いぞ
- デザインの幅が広がったのはもちろんのこと、今ではPCに入っていない言語もWeb上で表示できる
- world-wideになったね、web
- 標準化のつらさはどうしても付きまとう
- Acid2
- MicrosoftのIEを含めて、みんながんばってます
終盤は彼が現在所属しているOperaの話が多かった。どれだけデータ量削減に力を入れているか、という話。
あと、最近イースター島まで航海した話。完全にただの個人の日記だったけど、「実際にこの目でみるとWikipediaに書かれていることと異なる発見もあった」みたいなことを言っていて、なんか良い話っぽくなってた。ずるい。
さらにWebの未来について、同じノルウェー国内でも地域ごとに新規ドメインを策定して、Web上のZoneを分けていこうという話があった。『広告の無いドメイン』とか作っていきましょう、みたいな雰囲気。なんでもできるようになった広い広いWebの世界をいかに“住みやすく”するか。
この他に一般セッションもいくつか聞いたけど、そっちはあまり印象に残っていない。
自分の見た限りでは、実験的にUXの有効性や検索行動の傾向を探るという共通目標がまずあって、どんな実験を設定して、結論が有意であることをいかに示すかが重視されている様子だった。
ノルウェー・オスロの良さ
前回のRecSys同様ひとりぼっちの国際会議だったけど、たくさん歩いて、たくさん食べて、たくさんコーヒーとビールを飲んで、最高だった。
▲ 滞在中にInstagramに上げた写真は8枚がビールで、あと1枚はオスロのFuglenに行ったときのもの。一番おいしかったのは乗り継ぎのヘルシンキ空港で飲んだ濃厚なフィンランドビール Karhu。ノルウェービールの定番 Ringnes はさっぱりしすぎていてつまらなかった。
会議のオープニングでChairの人が「とても暖かくて物価の安いオスロへようこそ!」と自虐するくらい、寒くて、洒落にならないほど物価の高い街だった。(とはいえ、気候は3月のノルウェー=2月の北陸や東北の都市部、くらいの印象なので恐れることはない。)物価に関してはペットボトルの水が1本で360円もするし、1回の支払いが500円以内におさまることはほぼ無い。
そこさえ目をつぶると、人は穏やかで優しかったし、ご飯(特にチーズと穀類と魚)も美味しいし、彫刻が街にいっぱいあってテンションあがるし、朝はスズメじゃなくてカモメの鳴き声だし、なんだか全体的にとっても居心地がよかった。
観光地としての素晴らしさも文句なしで、きれいなオペラハウスやオスロ国立美術館(あのムンクの『叫び』が展示されていて館内撮影し放題!)、彫刻公園(広い敷地内に大量の彫刻があって面白い)などがあり飽きない。クルーズ船の運行日の都合でフィヨルドを見れなかったのが心残りだけど、それはまたの機会に。
「修士課程を終えるまでにもう一度国際会議にいきたいなぁ」「できれば未経験のポスター発表がいいなぁ」と思っていたところで見つけたのがCHIIR2017だった。研究分野という意味では少し期待外れだったけど、それでも全体としてはとても充実した楽しい時間を過ごせた。
ACM SIGIRの小規模会議として2016年にできたばかりのCHIIR、来年はアメリカ・ニュージャージー、再来年はスコットランド・グラスゴーでの開催がすでに決定している。参加者は多すぎず交流しやすいし、比較的採択されやすい会議でもあると思うので、情報検索、特にインタラクション(UI, UX)寄りの話題に興味がある方はぜひ。
▲ 会場の大学内にあった彫刻です。
シェアする
カテゴリ
あわせて読みたい
- 2017-03-31
- 修士課程で機械学習が専門ではない指導教員の下で機械学習を学ぶために
- 2016-09-28
- 推薦システムのトップ会議RecSys2016に参加した #recsys2016
- 2015-12-08
- ストリームデータ解析の世界
最終更新日: 2022-01-18
書いた人: たくち
Takuya Kitazawa(たくち)です。長野県出身、カナダ・バンクーバー在住のソフトウェアエンジニア。これまでB2B/B2Cの各領域で、Web技術・データサイエンス・機械学習のプロダクト化および顧客への導入支援・コンサルティング、そして関連分野の啓蒙活動に携わってきました。現在は主に北米(カナダ)、アジア(日本)、アフリカ(マラウイ)の個人および企業を対象にフリーランスとして活動中。詳しい経歴はレジュメ を参照ください。いろいろなまちを走って、時に自然と戯れながら、その時間その場所の「日常」を生きています。ご意見・ご感想およびお仕事のご相談は [email protected] まで。
近況 一杯のコーヒーを贈る免責事項
- Amazonのアソシエイトとして、当サイトは amazon.co.jp 上の適格販売により収入を得ています。
- 当サイトおよび関連するメディア上での発言はすべて私個人の見解であり、所属する(あるいは過去に所属した)組織のいかなる見解を代表するものでもありません。
- 当サイトのコンテンツ・情報につきまして、可能な限り正確な情報を掲載するよう努めておりますが、個人ブログという性質上、誤情報や客観性を欠いた意見が入り込んでいることもございます。いかなる場合でも、当サイトおよびリンク先に掲載された内容によって生じた損害等の一切の責任を負いかねますのでご了承ください。
- その他、記事の内容や掲載画像などに問題がございましたら、直接メールでご連絡ください。確認の後、対応させていただきます。