3次元姿勢推定(3D Pose Estimation)の優位性
3次元空間における人体姿勢の推定(3次元姿勢推定/3D Pose Estimation)は、不審人物の行動検知や、ロボットやアニメーションの動作への活用など、様々な分野への応用が期待されており、ここ数年で目まぐるしい発展を遂げています。
しかし依然として、2次元の姿勢推定よりもはるかに難易度が高い技術領域でもあります。
カラー画像から高精度に3次元姿勢を推定するために、一般的には複数のセンサを用いたモーションキャプチャや、ボディスーツなどの高価な設備が必要となります。
そのような中Global Walkersでは、導入しやすい3次元姿勢推定技術『GW-Pose』を開発しています。
独自の3次元姿勢推定技術(GW-Pose)
GW-PoseはDepthカメラから得られるカラー画像と距離情報を活用する事で、3次元空間における人の関節位置を高い精度で計測します。また、動画像からリアルタイムで3次元姿勢推定を行うことも可能です。
Depthカメラが計測できる距離内であれば、従来の設備を利用した3次元姿勢推定が不得手としていた「場所を問わない利用」が可能です。例えば、工場内やスポーツイベント会場、オフィス環境などにおいてもご利用いただけます。
また、Global WalkersではGW-Poseの性能評価を目的とした開発者向けキットを提供しています。
開発者向けキットではGW-Poseの基本的な機能をお試しいただけるほか、追加学習によるカスタマイズにも対応可能です。
3次元姿勢推定技術(GW-Pose)の特徴
正確性
3次元カメラから得られる距離情報を用いることで、RGB値のみを用いたAIモデルに比べてはるかに正確な姿勢推定を実現しています。
低負荷
一般的なノートパソコン(NVIDIAのGPUを搭載したもの)においても10~100フレーム/秒程度の推論処理が行えます。NVIDIA Jetsonなどの小型コンピュータでもリアルタイム処理が可能です。
拡張性
X86やARMプロセッサにも互換性があります。Depthカメラだけではなく、ToFカメラなどを活用することも可能です。
リアルタイム出力
18個の身体部位の3次元座標を、最大100フレーム/秒で出力することができます。
18個の身体部位以外の3次元座標を計測したい場合は、カスタマイズも可能です。
複数人の同時察知
複数人が映っている場合であっても、一人のみが映っている場合と同等の速度や精度で、複数人の3次元姿勢を同時にリアルタイムで推論することが可能です。
導入コスト
必要なデバイスは1台のコンピュータと、1台のDepthカメラのみです。
シンプルかつコンパクトなシステム構成であるため、ロボットやドローンへの搭載も可能です。