10月24日浙江大学陈昊、刘明宇学术报告预告
作者: 发布日期:2025-10-23 浏览次数:

报告题目:Towards Better and General Way to Understand and Interact with the World

报告人:陈昊、刘明宇

报告时间:20251024周五)上午10:00

地点:信息楼D533

报告摘要:

海量互联网数据预训练赋予了多模态大模型和世界模型感知,理解,预测世界的能力,但是如何更好的把这些能力带入物理世界,增强具身智能体与真实世界交互的能力依旧是亟待解决的难题,本次报告主要介绍Bridge Thinking and Acting: Unleashing Physical Potential of VLM with Generalizable Action ExpertStaMo: Unsupervised Learning of Generalizable Robot Motion from Compact State Representation两篇工作,同时介绍我们之前的一些相关的前置工作,分享我们在增强大模型与物理世界交互能力的道路上的一些探索和经验。

报告人简介:

陈昊,浙江大学百人计划研究员。长期致力于计算机视觉、人工智能等领域的研究。近年来在TPAMICVPR等国际高水平期刊会议发表论文40余篇,所做工作受邀在多个CCF A类国际会议做口头报告。代表作引领了全卷积目标检测和实例分割网络的研究趋势。其中FCOS为国际顶级会议ICCV历史最高引用论文之一。汇总多个自研算法主导开发并开源算法库AdelaiDet在业内获得广泛使用(GitHub两千星)。在多个人工智能算法竞赛中获得冠军,方向涵盖视觉感知、深度估计与文字检测识别等。主持多项科技部项目。

刘明宇,浙江大学计算机学院CAD&CG国家重点实验室博士研究生(博二),师从沈春华教授,主要研究方向为多模态大模型,具身智能。