Data-driven Crowd Analysis in Videos (ICCV2011)を読んだ
Data-driven Crowd Analysis in Videos (ICCV2011)を読んだ
Mikel Rodriguez, Josef Sivic, Ivan Laptev, Jean-Yves Audibert, “Data-driven Crowd Analysis in Videos”, in ICCV2011.
Project Page
を読んだので、メモです。
Summary
tl;dr
- 高密度な群集内の個人を追跡を転移学習によって精度を向上させる手法
Contribution
- 追跡の精度を転移学習によって向上させた
- 転移学習を行うためのデータセットとそのフレームワークを考案
論文内では、転移学習の例としてマラソンA
の群集を対象に追跡する際に、以下の流れで転移学習を行う。
- 大域的な群衆状況のマッチング : 同じようなシーンを探索(この場合 DB 内にあるマラソン動画)
- 局所的な群衆状況のマッチング :
1
でマッチした動画においてオプティカルフローが類似するパッチを探索して転移学習
また、Rare Events(デモの最中に群集を横断するカメラマンなど、群衆の流れに対して同調しない動きを行う人物)に対しても実験を行い評価。
Comments
転移学習は自分のイメージだと、自然言語処理のイメージ(一般的な文書を学習したモデルを法律文書に対して適用するなど)しかなかったので新鮮な気持ちで読めた。
動画なら転移学習を行ったとしても、直感的に良い特徴を学べそうなので、良い仮説を立てている論文でした。
最後に示されてる個人追跡における平均誤検出の単位がpixel
だが、Ground-Truth と提案手法の追跡軌跡の重複度具合を見てると誤検出が更に高そうに見えるけどどうなんでしょうか?
(テストデータのみ学習が 58.82
、転移学習を行った提案手法だと 46.88
になっていてもっと相対的な差が出てくるはず?)
関連しているかもしれない記事
- Slicing Convolutional Neural Network for Crowd Video Understanding (CVPR2016)を読んだ
- Analyzing Free-standing Conversational Groups: A Multimodal Approach (ACMMM15) を読んだ
- Call center stress recognition with person-specific models を読んだ
- FUSE: Full Spectral Clustering(KDD2016) を読んだ
- “Learning Deep Representations for Graph Clustering (AAAI2014)” を読んだ
Support
記事をお読みくださりありがとうございます。 このウェブサイトの運営を支援していただける方を募集しています。 もしよろしければ、Buy Me a Coffee からサポート(投げ銭)していただけると、記事の執筆、情報発信のモチベーションに繋がります✨--
記事を楽しめましたか? RSSで更新情報を配信しているので、お好きなフィードリーダーで購読してみてください。また、記事へのリアクションやコメントなどを、以下のGitHub を利用したコメントシステムからしていただけると執筆の励みになります。