aki_iic’s blog

己の欲せざる処人に施す事無かれ、狂人の真似するは即ち狂人なり

今月の日経Robotics(Nikkei Robotics)

 今月とは令和八年如月(2026年2月)を指します。

 ちょっとご無沙汰しておりますがFacebookの「広告」として投稿されてた日経ロボティックスの記事より。

xtech.nikkei.com

手と足を協調動作

 今回のドア開けタスクは、このロコモーションでのsim2realを発展させ、そこに手指によるマニピュレーションを付け加えたものである。手でドアのハンドルを回すといった動作はマニピュレーション的だが、ドアを開けたり、そこを通過したりする際は、脚のロコモーションも伴う。上半身と下半身の両方を協調させて動かす必要があり、ロコ・マニピュレーション(loco-manipulation)と呼ばれる領域である(表1)。

 複雑なマニピュレーションについては現在、大規模言語モデルを基にしたロボットAI「VLA(vision-language-action)モデル」を用いて模倣学習や強化学習が試みられているが、基本的に実機での学習が主体であり、シミュレータ上での強化学習(sim2real)はほとんど進展していない。シミュレータ上という以前に、VLAの内部でロボット行動生成に使われている「拡散モデル」が強化学習に向かないことがボトルネックとなっていたほか3)、接触力の模擬やvisionの精度についてシミュレータと現実とのギャップがまだ大きいことなどが要因だ。

表1 sim-to-realなど強化学習の適用領域の現状
下半身側はsim-to-realが中心になってきているが、マニピュレーションはまだ実機ベースの強化学習が主流である。緑色の領域は現状で主に用いられている手法。

 ただ、手を使う動作といっても、オブジェクトを把持して指を器用に使うような純粋なマニピュレーションタスクではなく、ドアのハンドルを回すといった程度のタスクであれば、実機ベースの学習ではなくシミュレータ上のsim2realでも十分達成可能ということを今回、NVIDIAなどが示した形だ。

 そもそもドア開けタスクでは、精巧な多指ハンドで器用にハンドルを握る必然性はなく、アクチュエータなしの静的なフックのようなハンドでハンドルのレバーを引っかけるだけでもタスクは成功させられる。例えば、sim2realの先駆者であるETH Zurichの研究グループは2024年、4脚ロボット+単腕アームという構成でフックのようなハンドを用い、sim2realによるドア開けを成功させている4)。開け放たれたドアをバネの力で自動的に閉めるようにする「ドアクローザー」が装着されている場合、ドアが強制的に閉じようとするため、それを手で支えながら体を通過させる必要があり、タスク難易度が急激に上がる。ETH Zurichはこうしたドアクローザー付きのケースでもsim2realで成功させている

引用おわり。

 人間って大したものでドアノブ操作というロボットにとっては難しい(専用ノブ等ではなくさまざまな形態・機能のKnob)タスクを実機学習ではなくsim2realというシミュレータで実現するという強化学習系での対応の様です。そういえば最後のパラグラフのETH Zurichって日本企業に買収の話があったような・・・

 この手のテーマの記事はバックナンバーでも記載されていたので進捗というか続編的な読み方出来る自分がちょっと嬉しい(まだ紙バージョン回収していないのだが:)。

#日経ロボの編集長様は難しい技術を手抜きせずに解りやすく(数式有りで)解説して頂けるので門外漢にとっては大変有り難いです。自分へのリスキリング投資として(まあ、気持ちですよ、気合というか)もう一年購読契約しました(自動更新だから解約しなかっただけですが)。

 こういう現場に近い処での情報を参照しているとAGIがうんちゃらとか道化者が抜かしているのが噴飯物で(失笑レベル)、そんな暇あったら貴様の変態脱衣Grokをお前(イーロン・マスク変態道化者の事ですよ:)の変態性癖から少しは社会常識に近づける様にしないとお前のサービス、社会的に抹殺されるよ(本気)・・・とお硬いEU様は申しておるのに中二病全開で逆らうから・・・だから道化者と言われるのさ(哀れ)。