11月21日上海交通大学张卫东教授、浙江大学沈春华教授学术报告预告
作者:学院办公室 发布日期:2024-11-20 浏览次数:

报告题目:面向海上搜救的空海跨域立体协同系统关键技术

报告人:张卫东 教授 

报告时间:202411211515-1600

报告地点:信息楼D533

报告摘要:

报告以海上搜救为背景,介绍了一类由无人机和无人艇组成的无人搜救系统,该系统利用了无人机搜索范围大和通信距离远的优点,和无人艇续航时间长的优点,可构建响应快、成本低和无人员伤亡风险的空海立体搜救系统。报告介绍了国外发展现状,分析了无人机水上降落与陆地降落的不同之处,讨论了地标识别、位姿控制和协同决策等关键技术,展示了上海交通大学信息处理与先进控制团队近年完成的基于视觉导航的无人机水上着艇技术验证过程。

报告人简介:

张卫东,上海交通大学讲席教授、浙江工业大学运河讲座教授。国家高层次人才、享受国务院政府特殊津贴专家、国家重大专项首席、德国洪堡学者、爱思维尔高被引学者。现任上海高校船舶自动化工程研究中心主任,教育部海洋智能系统工程研究中心主任。研究领域包括智能控制理论和人工智能理论,及其在海上无人系统中的应用。出版1本英文专著;发表SCI论文200多篇,Google引用1.2万余次;申请国家发明专利62项。

报告题目:An overview of recent work in large multimodal models: video generation and perception

报告人:沈春华 教授

报告时间:202411211600-1645

报告地点:信息楼D533

报告摘要:

In this talk, I will give an overview of some of my recent work in the area of large multimodal models. In particular, I am interested in video generation and multi-modality perception. We propose a novel hierarchical framework that integrates the strengths of autoregressive models with diffusion-based rendering to pioneer long-duration video generation with intricate plot progressions and high visual fidelity. Second, we propose a method termed Framer for interactive frame interpolation, which targets producing smoothly transitioning frames between two images as per user creativity. I will also briefly some relevant work we did in multi-modal understanding.

报告人简介:

沈春华,浙江大学求是讲席教授,浙江工业大学运河讲座教授。国家高层次人才、科技部2030人工智能重大项目首席科学家。曾任澳大利亚阿德莱德大学教授、莫纳什大学兼职教授。研究方向为计算机视觉与机器学习。获得2019 Pattern Recognition 期刊最佳论文奖、2021 IEEE CVPR最佳论文提名。谷歌学术引用80000余次,H index 128