学术报告：Reinforcement Learning and Multi-Agent Consensus Applied to Smart Grid

发布人：王健发布时间：2019-05-13 浏览次数:229

主讲人：黄廷文（德州农工大学卡塔尔分校教授， Fellow of IEEE）

题目：强化学习和多智能体协同性在智能电网中的应用

时间：2019年5月16日上午10:00

地点：南教301

个人简介：

黄廷文，德州农工大学卡塔尔分校教授， IEEE Fellow，现担任国际学术期刊《IEEE Transactions on Cybernetics》、《IEEE Transactions on Neural Networks and Learning Systems》副主编，亚太神经网络学会主席。黄廷文教授于1990年获得西南大学学士学位，1993年获得四川大学硕士学位，2002年获得德州农工大学博士学位，2003年被聘为德州农工大学卡塔尔分校助理教授，2013年被聘为正教授。目前主要从事分布式控制与优化，多智能体协同性，神经计算的理论研究以及面向智能电网的应用研究。迄今为止，他在该领域出版3部学术著作，发表SCI期刊论文四百多篇, 其中IEEE Transactions系列汇刊一百余篇，还有重要国际会议论文包括IJCAI, 这些论文被SCI总共引用8000余次，谷歌学术统计引用12000余次，于2018年成为科睿唯安（Clarivate Analytics, 原汤森路透Thomson Reuters）2018年度全球高引科学家，主持了5个卡塔尔国家基金资助的国家优先研究项目，并于2015年获得卡塔尔国家基金会颁发的最佳研究项目奖。

报告摘要：

本报告将介绍博弈论模型、大规模优化问题和Q学习框架的有效计算方法，以解决不同的现实问题。在智能电网环境下，采用随机博弈的方法对电动汽车充电的需求响应策略进行了建模，提出了控制电动汽车充电行为的大数据分析框架。针对多能源微电网系统中的能源交易问题，提出了一种二阶随机博弈理论模型。在这两项工作中，利用条件风险值（cvar）的风险度量技术来估计高峰时段的超载风险和超调风险，同时利用Nesterov梯度法加速ADMM方法来求解两个博弈模型。考虑到个人隐私问题，将首次尝试在智能微电网的能源交易博弈中应用基于RL的算法，在没有先验信息的情况下选择策略，提出多年来主导分布式学习的强化学习（RL）研究分支。每个微电网对对手，甚至贸易伙伴都是私有的。为了解决这一挑战，基于重复博弈的新能源交易框架使每个微电网能够单独和随机选择一种在独立市场交易能源的概率策略，从而最大限度地提高其平均收入。此外，针对一个大规模的经济调度问题，开发了不同的分布式优化算法，包括基于协同的多智能体方法。

（编辑人张震）