G検定対策 究極カンペをつくろう#2 画像認識(一般物体認識、物体検出、セグメンテーション、姿勢推定)

G検定対策 究極カンペをつくろう#2 画像認識(一般物体認識、物体検出、セグメンテーション、姿勢推定) G検定
G検定対策 究極カンペをつくろう#2 画像認識(一般物体認識、物体検出、セグメンテーション、姿勢推定)

姿勢推定

最後に、姿勢推定について述べる。

姿勢推定

姿勢推定に関するモデルは比較的構造が単純であり、主にVGGとの関連性と、Parts Affinity Fields(PAF)との接続に注目すれば十分である。

PAFとは、人体の各部位間のつながりベクトル場として表現し、それを学習・推定する技術である。
この技術により、複数人の姿勢推定が可能となり、遮蔽物(オクルージョン)によって一部の部位が視認できない場合でも、関節位置の補完が可能となる。
PAFの導入により、より柔軟かつ精度の高い姿勢推定が実現されている。

姿勢推定モデルは、以下の3つのステージで構成されている。

  • ステージ1:粗い姿勢の推定を行う。
  • ステージ2:より精密なパーツ親和性(部位間の関係性)を推定する。
  • ステージ3以降:関節位置の詳細な推定を行う。

このように、推定の精度を段階的に高めながら、身体各部のつながりを推定し、最終的に関節の位置を特定する構造となっている。

参考文献:https://arxiv.org/pdf/1812.08008

まとめ

  • 画像認識の全体像を因果関係図で整理し、AlexNetを起点に各モデルの進化をたどる。
  • 一般物体認識から物体検出・セグメンテーション・姿勢推定まで、各カテゴリの代表モデルと技術を解説。
  • モデル同士の構造的なつながりや技術的背景を踏まえ、因果関係をもとに体系的に理解を深めていく。

バックナンバーはこちら

深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第3版

Amazon.co.jp

徹底攻略ディープラーニングG検定ジェネラリスト問題集 第3版 徹底攻略シリーズ

Amazon.co.jp

ディープラーニングG検定(ジェネラリスト) 法律・倫理テキスト

Amazon.co.jp

コメント

タイトルとURLをコピーしました