Title | 用于分布式计算集群调度的深度强化学习模型训练方法、装置及调度方法 |
Author | |
First Inventor | 李清
|
Original applicant | 鹏城实验室
; 清华大学深圳国际研究生院
; 南方科技大学
|
First applicant | 鹏城实验室
|
Address of First applicant | 518000 广东省深圳市南山区兴科一街2号
|
Current applicant | 鹏城实验室
; 清华大学深圳国际研究生院
; 南方科技大学
|
Address of Current applicant | 518000 广东省深圳市南山区兴科一街2号 (广东,深圳,南山区)
|
First Current Applicant | 鹏城实验室
|
Address of First Current Applicant | 518000 广东省深圳市南山区兴科一街2号 (广东,深圳,南山区)
|
Application Number | CN202110387715.7
|
Application Date | 2021-04-12
|
Open (Notice) Number | CN113033806B
|
Date Available | 2023-07-18
|
Publication Years | 2023-07-18
|
Status of Patent | 授权
|
Legal Date | 2023-07-18
|
Subtype | 授权发明
|
SUSTech Authorship | Others
|
Abstract | 本申请公开了一种用于分布式计算集群的深度强化学习模型训练方法、装置以及调度方法,所述方法包括采用深度强化学习框架建立若干第一调度模型和第二调度模型;通过若干第一调度模型确定训练样本集;基于训练样本集训练第二调度模型以得到模型参数;基于模型参数更新各第一调度模型中的第一深度强化学习智能体的模型参数,并继续执行通过若干第一调度模型确定训练样本集的步骤,直至第二调度模型满足预设条件以得到深度强化学习模型。本申请通过解耦深度强化学习训练的前向行动和后向学习过程,通过多个独立且同时与环境交互的第一调度模型生成训练样本集,再基于训练样本对第二调度模型进行训练,这样实现了大规模并行训练,提高了深度强化学习模型的训练速度,实现了分布式计算集群的高效利用。 |
Other Abstract | 本申请公开了一种用于分布式计算集群的深度强化学习模型训练方法、装置以及调度方法,所述方法包括采用深度强化学习框架建立若干第一调度模型和第二调度模型;通过若干第一调度模型确定训练样本集;基于训练样本集训练第二调度模型以得到模型参数;基于模型参数更新各第一调度模型中的第一深度强化学习智能体的模型参数,并继续执行通过若干第一调度模型确定训练样本集的步骤,直至第二调度模型满足预设条件以得到深度强化学习模型。本申请通过解耦深度强化学习训练的前向行动和后向学习过程,通过多个独立且同时与环境交互的第一调度模型生成训练样本集,再基于训练样本对第二调度模型进行训练,这样实现了大规模并行训练,提高了深度强化学习模型的训练速度,实现了分布式计算集群的高效利用。 |
CPC Classification Number | G06N3/08
; Y02D10/00
|
IPC Classification Number | G06N3/092
|
INPADOC Legal Status | (+PATENT GRANT)[2023-07-18][CN]
|
INPADOC Patent Family Count | 1
|
Extended Patent Family Count | 1
|
Priority date | 2021-04-12
|
Patent Agent | 温宏梅
|
Agency | 深圳市君胜知识产权代理事务所(普通合伙)
|
URL | [Source Record] |
Data Source | PatSnap
|
Document Type | Patent |
Identifier | http://kc.sustech.edu.cn/handle/2SGJ60CL/563335 |
Department | Institute of Future Networks Technology |
Recommended Citation GB/T 7714 |
李清,郭嘉伟,江勇,等. 用于分布式计算集群调度的深度强化学习模型训练方法、装置及调度方法[P]. 2023-07-18.
|
Files in This Item: | There are no files associated with this item. |
|
Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.
Edit Comment