自動車業界が入手した情報によると、自变量机器人(X自变量ロボット)は先日、次世代ロボットの家庭進出計画を正式に発表した。1か月後、同社が自社開発した最新の具身知能基盤モデル「WALL-B」を搭載したロボットが、初めて実際の家庭に導入され、ロボットが家庭生活にサービスを提供する成長の旅が始まる。

これに先立ち、自变量は58同城と協力し、同社の「WALL-AS」モデルを搭載したロボットを実際の家庭に送り込み、清掃スタッフと協働作業を行った。これは世界で初めてロボットが家庭に入り、複雑な家庭生活にサービスを提供した事例であり、またロボットが初めてC向けの複雑な環境で大規模に実用化された事例でもある。

自变量机器人发布首个世界统一模型

自变量机器人

今回新たに発表されたWALL-Bの最大の特長の一つは、視覚、言語、動作、物理予測など全ての能力を、同一のネットワーク内でゼロから共同訓練し一体化させた点にある。これにより、モジュール間の境界やデータ転送のロスが大幅に削減された。

このアーキテクチャに基づき、WALL-Bは業界の既存モデルとは異なる3つの中核的技術的特徴を実現している。

第一に、ネイティブなマルチモーダル性。WALL-Bは訓練開始初日から、視覚、聴覚、言語、触覚、動作などのマルチモーダルデータを同時にラベル付けし、共同訓練することで、「マルチモーダル入力、マルチモーダル出力」を実現。モデルは異なるモジュール間で情報を「伝言」する必要がなく、コップを見た瞬間に手を伸ばす準備を始め、重さを感じた瞬間に力を調整する。

さらに、WALL-Bは自身の全身を常に観察したり、多数の外部センサーに依存したりすることなく、自身の空間的なサイズ(高さ、幅、腕の可動範囲など)を内在的に認識し、ある空間を通り抜けられるか、物体に届くかを判断できる。これは外部測定やモデリングによるものではなく、内生的な空間認識能力である。

第二に、物理世界の「世界観」。WALL-Bは重力、慣性、摩擦力、速度などの基本的な物理法則を感知・予測できる。例えば、皿が机の端から半分はみ出しているような未経験の状況でも、皿が落ちて割れることを推測し、予防的な動作を取ることができる。

第三に、世界との相互作用と自己進化。現在主流のロボットはタスク失敗後、通常はそのまま停止しエラー情報を返すだけで、失敗から学習することはない。WALL-Bの行動パターンは全く異なり、失敗後は戦略を調整して再試行し、成功すればその成功経験を直接モデルパラメータに更新する。

注目すべき点として、ロボットの家庭進出に伴い、プライバシー問題も避けて通れない。これに対し、自变量は明確な解決策を提示している。

視覚の匿名化:ロボットはデバイス側で元の画像をリアルタイムにモザイク処理し、元画像はデバイスから出ず、ロボットが見るのは個人特徴を除去したシーンデータのみ。

透明な許可:ユーザーが同意ボタンを能動的に押した場合のみ起動可能で、「デフォルト同意」は存在せず、ユーザーが同意しない場合は起動しない。

用途の限定:第三者と絶対に共有せず、ロボットは一人の主人のみを認識し、不審な指令を検出した場合は即座にロックする。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です