8月3号中国人民大学数学学院沈栋教授及厦门大学师佳副教授学术论坛
作者:欧县华 发布日期:2023-08-02 浏览次数:

报告一:

题目:Variable gain design in stochastic iterative learning control

摘要:In this talk, we first revisit the concept of stochastic iterative learning control and the conventional P-type update law. There, we will observe that the P-type update law with a constant gain is insufficient to achieve the best tracking performance for a given reference. To address the effect of random noise, the constant gain should be replaced with a variable one. Then, four mainstream variable gain designs are given in sequence: decreasing gain design, optimal gain design, adaptive gain design, and event-triggering gain design.

时间:839:00-10:00

地点:信息学院C310会议室

 

报告人介绍:

沈栋,中国人民大学数学学院教授、博导,分布式人工智能实验室负责人。2010年毕业于中国科学院数学与系统科学研究院,获理学博士学位。20102012年在中科院自动化研究所从事博士后研究。2012年至2019年在北京化工大学信息科学与技术学院工作,历任副教授、教授。2020年起在中国人民大学数学学院任教授。现为中国自动化学会数据驱动控制、学习与优化专业委员会副主任委员,中国自动化学会控制理论专业委员会委员,IEEE Senior Member。担任国际期刊International Journal of Robust and Nonlinear Control, IEEE Access, IET Cyber-Systems and Robotics编委,IEEE/CAA Journal of Automatica Sinica青年编委。研究方向为迭代学习控制、随机系统的优化与控制、随机逼近算法等。学术专著《Iterative Learning Control Over Random Fading Channels》即将由CRC Press出版。负责Springer旗下“Intelligent Control and Learning Systems”系列丛书,目前已出版9部。

 

报告二:

题目:从迭代学习到强化学习

摘要:针对具有严格重复特性的复杂工业过程,迭代学习控制是一种行之有效的先进控制技术。但在实际工业应用中,过程的建模瓶颈以及系统不可避免的非重复和不确定性使得迭代学习控制系统的鲁棒性和最优性无法得到保证。不同于迭代学习,(深度)强化学习是一种基于探索式学习的无模型策略优化算法,不仅具有较好的过程普适性,同时采用神经网络的策略表达使得控制系统具有较好的鲁棒性,但该技术也存在学习效率低下的实际问题。本报告从学习思想本质的角度出发,探讨了迭代学习和强化学习不同的学习模式和用于过程控制时各自具有的优缺点。为了实现两种学习模式的优势互补,进一步探讨了将二者相结合的三种可行技术路线:1、将强化学习算法用于解决非线性迭代学习控制系统的设计问题,以提高迭代学习控制系统的最优性和鲁棒性;2、将两种学习方案并行实施,通过迭代学习控制的引导来提高强化学习算法的在线学习效率,并逐步实现投运,从而提升控制系统的鲁棒性和最优性;3、以迭代学习控制为主,同过强化学习的离线学习和在线补偿来增强系统对付非重复扰动的鲁棒性和最优性。通过这三种技术路线,展示了将强化学习技术与先进过程控制技术相结合的一些基本方法,为推动强化学习这一AI技术在工业过程控制的应用提供了一些新思路。

 

时间:8310:00-11:00

地点:信息学院C310会议室

 

报告人介绍:

师佳,厦门大学化学化工学院化学工程专业副教授、硕士和博士生导师。1997年毕业于厦门大学运筹学与控制论专业,获硕士学位;2006年获浙江大学控制科学与工程专业博士学位。20042006为香港科技大学化工系访问学者。主要从事面向复杂工业过程的智能学习控制理论以及相关应用技术研发。主要的研究兴趣为复杂工业过程的建模与先进过程控制理论和技术研发,包括强化学习控制、迭代学习控制、模型预测控制、自适应控制、鲁棒控制等。发表学术论文40余篇,出版专著2部,荣获教育部自然科学一等奖和福建省科学技术进步奖二等奖各1次,承担国家自然科学基金面上项目2项,国家重点研发项目子课题1项,完成企业委托研发项目十余项。