学术前沿

具身智能论文库

把论文从文章解读升级为学术实体,记录作者、机构、会议、方法、数据、结果、代码和相关硬件。

8
论文 DWL: Denoising World Model Learning

官网摘要称其利用 Denoising World Model 支持端到端强化学习人形机器人,并实现零样本 sim-to-real。

会议/期刊
NeurIPS 2022 ICBINB workshop (spotlight)
发表年份
2022
论文 DoReMi: Grounding Language Model by Detecting and Recovering from Plan-Execution Misalignment

提出即时检测与即时恢复框架。

会议/期刊
Published in IROS 2024
发表年份
2023
论文 HiRT: Hierarchical Robot Transformers

提出分层机器人 Transformer,官网摘要称成功率提升 20-30%,推理速度近乎翻倍。

会议/期刊
Accepted to CORL 2024
发表年份
2024
论文 PAD: Prediction with Action – Visual Policy Learning via Joint Denoising Process

提出预测-动作联合去噪框架,将图像预测与动作输出在同一扩散过程中学习。

会议/期刊
NeurIPS 2024
发表年份
2024
论文 Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations

利用视频扩散模型预测视觉表征作为机器人策略输入,实现通用机器人策略。

会议/期刊
ICML 2025 Spotlight Paper
发表年份
2024
论文 UP-VLA: A Unified Understanding and Prediction Model for Embodied Agent

首次构建统一视觉-语言-动作模型,增强空间细节和动态信息理解。

会议/期刊
Accepted to ICML2025
发表年份
2025
论文 iR-eVLA: Improving Visio-Language-Action Model with Online Reinforcement Learning

首次将在线强化学习系统化嵌入 VLA 框架。

会议/期刊
2025 IEEE International Conference on Robotics and Automation (ICRA)
发表年份
2025
论文 Ctrl-World: A Controllable Generative World Model for Robot Manipulation

首次提出可控生成式世界模型,突破单一视角、动作预测不精准、多时一致性差等限制。

会议/期刊
Robotics (cs.RO); Artificial Intelligence (cs.AI)
发表年份
2025