本申请涉及算力网络,具体涉及一种算网一体化资源调度系统、方法、电子设备及存储介质。
背景技术:
1、算力网络作为一种连接算力和网络的重要基础设施,在政策以及社会需求的双重驱动之下迅速发展。随着算力网络的发展,底层算力基础资源越来越成为国家、企业数字化转型的基础,在算力资源日益增多的情况下,如何做好资源之间的供需匹配、利用平衡已成为一个很大问题。
2、算力网络的资源调度场景下,目前通常存在以下问题:
3、1、对于资源调度方面,一方面由于异构问题,通算、超算、智算等异构算力当前难以做到统一调度。
4、2、对于业务层面,上层应用的部署状态、节点、位置难以和底层资源相结合,同时用户的调度请求通常为多种要素的集合,当存在大量用户同时调度时无法做到快速解析,快速响应。
5、3、对于智能层面,当前业界有关云、网等资源的调度多为用户指定或规则匹配的基于规则的调度,调度的准确性与时效性不足。
6、基于此,导致当前在进行算网资源的调度时效率低下。
技术实现思路
1、本申请实施例提供一种算网一体化资源调度系统、方法、电子设备及存储介质,用以解决当前进行算网资源调度时的效率低下的问题。
2、第一方面,本申请实施例提供一种算网一体化资源调度系统,包括算网编排模块、算网调度模块、算网感知模块与智能决策模块;
3、所述算网感知模块,用于对接所纳管算网资源的接口并采集算网资源数据;所述算网资源包括通用算力、超算与智算中的一种或多种;
4、所述智能决策模块,用于基于预置人工智能算法提供各业务场景下的算网资源编排策略;
5、所述算网编排模块,用于获取业务需求,根据所述业务需求从各算网资源编排策略中确定目标算网资源编排策略,根据所述目标算网资源编排策略结合所述业务需求,对所述算网资源数据进行算网资源调度编排,得到调度方案;
6、所述算网调度模块,用于执行所述调度方案。
7、在一个实施例中,所述算网编排模块包括意图分析单元,所述意图分析单元用于:
8、获取调度请求,对所述调度请求进行意图识别,得到所述调度请求对应的业务需求。
9、在一个实施例中,所述算网调度模块包括任务拆分单元与任务调度单元;
10、所述任务拆分单元,用于对所述调度方案进行拆分,得到相应数量的子任务;
11、所述任务调度单元,用于将各子任务通过所纳管算网资源的接口调度到相应的算网资源上进行执行。
12、在一个实施例中,所述算网感知模块包括感知处理单元;
13、所述感知处理单元,用于在所述任务调度单元将各子任务通过所纳管算网资源的接口调度到相应的算网资源上进行执行的过程中,若确定所述相应的算网资源的健康度低于预设健康度阈值,则对所述相应的算网资源进行扩容处理。
14、第二方面,本申请实施例提供一种算网一体化资源调度方法,包括:
15、获取业务需求,从所纳管算网资源中采集算网资源数据;所述算网资源包括通用算力、超算与智算中的一种或多种;
16、获取基于预置人工智能算法生成的各业务场景下的算网资源编排策略;
17、根据所述业务需求从各算网资源编排策略中确定目标算网资源编排策略;
18、根据所述目标算网资源编排策略结合所述业务需求,对所述算网资源数据进行算网资源调度编排,得到调度方案;
19、执行所述调度方案。
20、在一个实施例中,所述获取业务需求,包括:
21、获取调度请求,对所述调度请求进行意图识别,得到所述调度请求对应的业务需求。
22、在一个实施例中,所述执行所述调度方案,包括
23、对所述调度方案进行拆分,得到相应数量的子任务;
24、将各子任务通过所纳管算网资源的接口调度到相应的算网资源上进行执行。
25、在一个实施例中,在将各子任务通过所纳管算网资源的接口调度到相应的算网资源上进行执行时,还包括:
26、若确定所述相应的算网资源的健康度低于预设健康度阈值,则对所述相应的算网资源进行扩容处理。
27、第三方面,本申请实施例提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第二方面所述的算网一体化资源调度方法。
28、第四方面,本申请实施例提供一种存储介质,所述存储介质为计算机可读存储介质,包括计算机程序,所述计算机程序被处理器执行时实现第二方面所述的算网一体化资源调度方法。
29、本申请实施例提供的算网一体化资源调度系统、方法、电子设备及存储介质,通过包括算网编排模块、算网调度模块、算网感知模块与智能决策模块的算网一体化资源调度系统;可以对接所纳管通用算力、超算与智算中的一种或多种算网资源的接口并采集算网资源数据;基于预置人工智能算法提供各业务场景下的算网资源编排策略;进而可以获取业务需求,根据业务需求从各算网资源编排策略中确定目标算网资源编排策略,根据目标算网资源编排策略结合业务需求对算网资源数据进行算网资源调度编排,得到调度方案;由此可以执行调度方案以实现算力网络的资源调度。由于预先通过人工智能算法提供各业务场景下的算网资源编排策略,可以在获取到业务需求时根据业务需求快速确定出相应业务场景下的算网资源编排策略,并根据确定的算网资源编排策略结合业务需求,对通用算力、超算与智算等跨域、跨厂商的异构算网资源数据进行算网资源编排,由此可以完成业务的快速响应、跨域、跨厂商的异构算网资源的智能、精准调度,进而提高算网资源的调度效率。
1.一种算网一体化资源调度系统,其特征在于,包括算网编排模块、算网调度模块、算网感知模块与智能决策模块;
2.根据权利要求1所述的算网一体化资源调度系统,其特征在于,所述算网编排模块包括意图分析单元,所述意图分析单元用于:
3.根据权利要求1所述的算网一体化资源调度系统,其特征在于,所述算网调度模块包括任务拆分单元与任务调度单元;
4.根据权利要求3所述的算网一体化资源调度系统,其特征在于,所述算网感知模块包括感知处理单元;
5.一种算网一体化资源调度方法,其特征在于,包括:
6.根据权利要求5所述的算网一体化资源调度方法,其特征在于,所述获取业务需求,包括:
7.根据权利要求5所述的算网一体化资源调度方法,其特征在于,所述执行所述调度方案,包括
8.根据权利要求7所述的算网一体化资源调度方法,其特征在于,在将各子任务通过所纳管算网资源的接口调度到相应的算网资源上进行执行时,还包括:
9.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求5至8任一项所述的算网一体化资源调度方法。
10.一种存储介质,所述存储介质为计算机可读存储介质,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求5至8任一项所述的算网一体化资源调度方法。
