学术前沿

Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations

利用视频扩散模型预测视觉表征作为机器人策略输入,实现通用机器人策略。

论文

主体信息

利用视频扩散模型预测视觉表征作为机器人策略输入,实现通用机器人策略。

来源:RobotEra ERA-42 官网模型时间线,时间标记为 2024.12。