8月29日下午,由校青协、校科协和计算机科学与工程学院联合主办的“星期三青年学者讲堂”第240讲在我校学术交流中心第六会议室如期举行。本次主讲“星期三青年学者讲堂”的是来计算机科学与工程学院的蔡志成教授,主讲的题目是“基于深度强化学习的云计算资源调度”,讲座由计算机科学与工程学院李千目老师主持,来自计算机科学与工程学院的师生参加了此次讲座。
蔡志成教授以目前大热的AlphaGo为切入点,结合前者研究,深入介绍了深度强化学习概念。深度强化学习是深度学习和强化学习的有机结合,是推动通用人工智能发展的有效途径。强化学习融合了基于环境的自主学习,通过与环境交互更新值函数,并基于值函数对策略进行更新。然而对于状态空间爆炸的情况,传统基于表格类的强化学习方法学习代价太大。因此,可以利用深度神经网络对状态行为值函数进行模拟,提升泛化能力。为了训练深度网络,可以利用强化学习取得的经验对深度网络进行有监督学习,使得深度神经网络可以对行为决策值函数空间进行很好拟合。对于大量云计算应用的资源调度问题,蔡志成教授提出利用属于马尔科夫决策过程建模方法。目前存在一些基于规则的资源动态租赁和调度方法,但是由于状态和行为空间巨大,依然有很大提升空间。
深度强化学习目前具有很大的发展前景,已应用于交互式探索,无人驾驶,文本生成等领域。利用深度强化学习实现云计算资源调度具有很强的可行性并效果显著。
在提问环节,到场师生进行了简短的讨论,同学们针对强化学习以及马尔科夫决策问题进行提问和交流。
报告人简介:
蔡志成,计算机科学与工程学院,副教授、博士;CCF协同计算专委会委员、IEEE会员。主要从事云计算、服务计算、智能化云计算应用调度等方面研究。主持国家自然科学基金(青年基金)1项、江苏省自然科学基金(青年基金)1项、教育部和其他重点实验室开放课题3项。近五年在IEEE Transactions on Services Computing、IEEE Transactions on Cloud Computing、IEEE Transactions on Automation Science and Engineering、Future Generation Computer Systems、Journal of Grid Computing等国际期刊和会议发表学术论文十余篇。