中文版 | English
Title

用于分布式计算集群调度的深度强化学习模型训练方法、装置及调度方法

Author
First Inventor
李清
Original applicant
鹏城实验室 ; 清华大学深圳国际研究生院 ; 南方科技大学
First applicant
鹏城实验室
Address of First applicant
518000 广东省深圳市南山区兴科一街2号
Current applicant
鹏城实验室 ; 清华大学深圳国际研究生院 ; 南方科技大学
Address of Current applicant
518000 广东省深圳市南山区兴科一街2号 (广东,深圳,南山区)
First Current Applicant
鹏城实验室
Address of First Current Applicant
518000 广东省深圳市南山区兴科一街2号 (广东,深圳,南山区)
Application Number
CN202110387715.7
Application Date
2021-04-12
Open (Notice) Number
CN113033806B
Date Available
2023-07-18
Publication Years
2023-07-18
Status of Patent
授权
Legal Date
2023-07-18
Subtype
授权发明
SUSTech Authorship
Others
Abstract
本申请公开了一种用于分布式计算集群的深度强化学习模型训练方法、装置以及调度方法,所述方法包括采用深度强化学习框架建立若干第一调度模型和第二调度模型;通过若干第一调度模型确定训练样本集;基于训练样本集训练第二调度模型以得到模型参数;基于模型参数更新各第一调度模型中的第一深度强化学习智能体的模型参数,并继续执行通过若干第一调度模型确定训练样本集的步骤,直至第二调度模型满足预设条件以得到深度强化学习模型。本申请通过解耦深度强化学习训练的前向行动和后向学习过程,通过多个独立且同时与环境交互的第一调度模型生成训练样本集,再基于训练样本对第二调度模型进行训练,这样实现了大规模并行训练,提高了深度强化学习模型的训练速度,实现了分布式计算集群的高效利用。
Other Abstract
本申请公开了一种用于分布式计算集群的深度强化学习模型训练方法、装置以及调度方法,所述方法包括采用深度强化学习框架建立若干第一调度模型和第二调度模型;通过若干第一调度模型确定训练样本集;基于训练样本集训练第二调度模型以得到模型参数;基于模型参数更新各第一调度模型中的第一深度强化学习智能体的模型参数,并继续执行通过若干第一调度模型确定训练样本集的步骤,直至第二调度模型满足预设条件以得到深度强化学习模型。本申请通过解耦深度强化学习训练的前向行动和后向学习过程,通过多个独立且同时与环境交互的第一调度模型生成训练样本集,再基于训练样本对第二调度模型进行训练,这样实现了大规模并行训练,提高了深度强化学习模型的训练速度,实现了分布式计算集群的高效利用。
CPC Classification Number
G06N3/08 ; Y02D10/00
IPC Classification Number
G06N3/092
INPADOC Legal Status
(+PATENT GRANT)[2023-07-18][CN]
INPADOC Patent Family Count
1
Extended Patent Family Count
1
Priority date
2021-04-12
Patent Agent
温宏梅
Agency
深圳市君胜知识产权代理事务所(普通合伙)
URL[Source Record]
Data Source
PatSnap
Document TypePatent
Identifierhttp://kc.sustech.edu.cn/handle/2SGJ60CL/563335
DepartmentInstitute of Future Networks Technology
Recommended Citation
GB/T 7714
李清,郭嘉伟,江勇,等. 用于分布式计算集群调度的深度强化学习模型训练方法、装置及调度方法[P]. 2023-07-18.
Files in This Item:
There are no files associated with this item.
Related Services
Fulltext link
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Export to Excel
Export to Csv
Altmetrics Score
Google Scholar
Similar articles in Google Scholar
[李清]'s Articles
[郭嘉伟]'s Articles
[江勇]'s Articles
Baidu Scholar
Similar articles in Baidu Scholar
[李清]'s Articles
[郭嘉伟]'s Articles
[江勇]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[李清]'s Articles
[郭嘉伟]'s Articles
[江勇]'s Articles
Terms of Use
No data!
Social Bookmark/Share
No comment.

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.