Analyzing Free-standing Conversational Groups: A Multimodal Approach (ACMMM15) を読んだ

2018-01-14

スタンディングディスカッション形式での会話を評価した研究

Summary Slide

X Alameda-Pineda, Y Yan, E Ricci, O Lanz, N Sebe
“Analyzing Free-standing Conversational Groups: A Multimodal Approach”, in 2015 ACM Multimedia Conference

link

を読んだので、軽くメモ。

マルチモーダル系の論文初めて読んだんですが、まとめるとコントリビューションが 5 つあると主張。

Contribution

音声・近接情報、そして監視カメラからの身体と頭の姿勢推定からマルチモーダルに解析
フリースタンディングディスカッションを身体・頭の姿勢推定から解析
カメラと音声・近接センサーからなるマルチモーダルな解析するためのフレームワークを提案
ラベリングされてないデータに対する行列補間問題の考案
SALSA(データ・セット)を公開・評価

SALSA というポスターセッションの動画と音声のデータも公開されている

SALSA: Synergetic sociAL Scene Analysis

動画は Google Drive で公開されていて時代の波を感じる。

データセットを公開
論文も読みやすい
新しい行列補完計画法(アルゴリズム)を提案
実問題に取り組む

と盛り沢山な内容で面白かった。

スライド内のリンクは Google Slide で共有しているのでこちらを参照すると便利です。

X Alameda-Pineda, Y Yan, E Ricci, O Lanz, N Sebe "Analyzing Free-standing Conversational Groups: A…

---

関連しているかもしれない記事

📮 📧 🐏: 記事への感想のおたよりをおまちしてます。お気軽にお送りください。メールアドレス入力があればメールで返信させていただきます。もちろんお返事を希望せずに単なる感想だけでも大歓迎です。

このサイトの更新情報をRSSで配信しています。お好きなフィードリーダーで購読してみてください。

このウェブサイトの運営や著者の活動を支援していただける方を募集しています。もしよろしければ、Buy Me a Coffee からサポート(投げ銭)していただけると、著者の活動のモチベーションに繋がります✨
Amazonでほしいものリストも公開しているので、こちらからもサポートしていただけると励みになります。

#paper #computervision #machinelearning