スタンディングディスカッション形式での会話を評価した研究

image

Summary Slide

X Alameda-Pineda, Y Yan, E Ricci, O Lanz, N Sebe
“Analyzing Free-standing Conversational Groups: A Multimodal Approach”, in 2015 ACM Multimedia Conference

link

を読んだので、軽くメモ。

マルチモーダル系の論文初めて読んだんですが、まとめるとコントリビューションが 5 つあると主張。

Contribution

  • 音声・近接情報、そして監視カメラからの身体と頭の姿勢推定からマルチモーダルに解析
  • フリースタンディングディスカッションを身体・頭の姿勢推定から解析
  • カメラと音声・近接センサーからなるマルチモーダルな解析するためのフレームワークを提案
  • ラベリングされてないデータに対する行列補間問題の考案
  • SALSA(データ・セット)を公開・評価

SALSA というポスターセッションの動画と音声のデータも公開されている

SALSA: Synergetic sociAL Scene Analysis

動画は Google Drive で公開されていて時代の波を感じる。

  • データセットを公開
  • 論文も読みやすい
  • 新しい行列補完計画法(アルゴリズム)を提案
  • 実問題に取り組む

と盛り沢山な内容で面白かった。

スライド内のリンクは Google Slide で共有しているのでこちらを参照すると便利です。

X Alameda-Pineda, Y Yan, E Ricci, O Lanz, N Sebe "Analyzing Free-standing Conversational Groups: A…

See Also

Support

記事をお読みくださりありがとうございます。このウェブサイトの運営を支援していただける方を募集しています。 もしよろしければ、下のボタンからサポート(投げ銭)していただけると、ブログ執筆、情報発信のモチベーションに繋がります✨