本发明涉及人工智能,尤其涉及一种算力资源访问方法、算力资源访问系统及计算设备。
背景技术:
1、随着人工智能的快速发展,算力资源显得越来越重要,尤其是智算算力资源,这些需求给算力市场带来了新的机遇,因此,很多企业投入了大量资金来构建各种算力资源。然而,根据现有技术无法实现这些算力资源的互联互通,导致用户无法方便地使用算力资源,且资源利用率较低。如何将这些算力资源联通起来,以方便用户使用,同时能根据算力使用情况来进行合理调度,亟待解决。
2、因此,需要一种算力资源访问方法,来解决上述技术方案中存在的问题。
技术实现思路
1、为此,本发明提供一种算力资源访问方法及算力资源访问系统,以解决或至少缓解上面存在的问题。
2、根据本发明的一个方面,提供一种算力资源访问方法,在注册服务器中执行以访问多种算力资源,所述注册服务器与代理服务器、每种算力资源分别对应的多个算力提供设备通信连接,所述代理服务器与一个或多个客户端通信连接,所述方法包括:获取各个所述算力提供设备发送的所述算力提供设备的资源访问信息和资源使用状态信息;接收客户端经由代理服务器发送的目标算力资源访问请求,基于所述目标算力资源访问请求确定目标算力资源对应的多个算力提供设备;基于目标算力资源对应的各个算力提供设备的资源使用状态信息,确定目标算力资源对应的各个算力提供设备的空闲算力,并确定空闲算力最高的预定数量个算力提供设备,所述算力提供设备的空闲算力包括所述算力提供设备的当前可用卡数或当前可用核数;将最近预定时间内接收到的多个目标算力资源访问请求,均匀分发至所述预定数量个算力提供设备,并确定所述客户端的目标算力资源访问请求对应的目标算力提供设备;将所述目标算力提供设备的目标资源访问信息发送至所述代理服务器,以便所述代理服务器基于所述目标资源访问信息访问所述目标算力提供设备提供的目标算力资源,并将所述目标算力资源提供至所述客户端。
3、可选地,在根据本发明的算力资源访问方法中,确定空闲算力最高的预定数量个算力提供设备,包括:基于空闲算力对目标算力资源对应的各个算力提供设备进行排序,并获取空闲算力最高的预定数量个算力提供设备信息,形成目标队列;将最近预定时间内接收到的多个目标算力资源访问请求,均匀分发至所述预定数量个算力提供设备,包括:将最近预定时间内接收到的多个目标算力资源访问请求,依次均匀分发至所述目标队列中的预定数量个算力提供设备信息对应的预定数量个算力提供设备。
4、可选地,在根据本发明的算力资源访问方法中,每种算力资源分别对应一个消息通道;获取各个所述算力提供设备发送的所述算力提供设备的资源访问信息和资源使用状态信息,包括:获取各个所述算力提供设备经由与所述算力提供设备的算力资源相对应的消息通道,实时发送的所述算力提供设备的资源使用状态信息;其中,所述算力提供设备的资源使用状态信息包括所述算力提供设备的空闲算力、所述算力提供设备的访问请求清单;所述算力提供设备的访问请求清单中包括所述算力提供设备对应的各个访问请求。
5、可选地,在根据本发明的算力资源访问方法中,还包括:响应于所述目标队列中的任一算力提供设备信息对应的访问请求清单中的访问请求数量超过预定阈值,将所述任一算力提供设备信息移至所述目标队列的队尾。
6、可选地,在根据本发明的算力资源访问方法中,还包括:基于各个所述算力提供设备的资源访问信息,生成资源访问信息清单,所述资源访问信息包括算力提供设备信息、算力资源的通信协议和访问地址;基于所述目标算力资源访问请求确定目标算力资源对应的多个算力提供设备,包括:从所述资源访问信息清单中,获取与所述目标算力资源访问请求相对应的多个算力提供设备信息,以确定所述目标算力资源对应的多个算力提供设备,其中,所述目标算力资源访问请求中包含目标通信协议。
7、可选地,在根据本发明的算力资源访问方法中,还包括:响应于客户端经由代理服务器发送的对所述资源访问信息清单的查询请求,将所述资源访问信息清单经由代理服务器返回至所述客户端;其中,客户端适于从所述资源访问信息清单中选择任一算力提供设备的资源访问信息,并经由所述代理服务器基于所述任一算力提供设备的资源访问信息,访问所述任一算力提供设备提供的算力资源。
8、可选地,在根据本发明的算力资源访问方法中,目标算力资源访问请求中包含目标通信协议信息;所述代理服务器适于:基于所述目标算力资源访问请求确定目标通信协议,将所述目标通信协议对应的界面发送至所述客户端,以便所述客户端基于所述目标通信协议对应的界面访问目标算力资源。
9、可选地,在根据本发明的算力资源访问方法中,接收客户端经由代理服务器发送的目标算力资源访问请求,包括:接收所述客户端基于用户认证信息,经由代理服务器发送的目标算力资源访问请求;其中,所述用户认证信息用于将所述客户端的用户信息与所述目标算力提供设备信息进行映射,以便基于所述用户认证信息对来自所述客户端的所述目标算力资源访问请求进行认证。
10、可选地,在根据本发明的算力资源访问方法中,所述多种算力资源包括智算算力资源、超算算力资源和通算算力资源。
11、可选地,在根据本发明的算力资源访问方法中,获取各个所述算力提供设备发送的所述算力提供设备的资源访问信息和资源使用状态信息,还包括:获取各个所述算力提供设备经由与所述算力提供设备的算力资源相对应的消息通道,发送的所述算力提供设备的资源访问信息。
12、根据本发明的一个方面,提供一种算力资源访问系统,用于访问多种算力资源,所述系统包括:注册服务器,与每种算力资源分别对应的多个算力提供设备通信连接,适于执行如上所述的方法;代理服务器,与所述注册服务器通信连接,并适于与每种算力资源分别对应的多个算力提供设备通信连接,以访问各个算力提供设备提供的算力资源;一个或多个客户端,与所述代理服务器通信连接,适于经由所述代理服务器向所述注册服务器发送目标算力资源访问请求。
13、根据本发明的一个方面,提供一种计算设备,包括:至少一个处理器;存储器,存储有程序指令,其中,程序指令被配置为适于由上述至少一个处理器执行,所述程序指令包括用于执行如上所述的算力资源访问方法的指令。
14、根据本发明的一个方面,提供一种计算机程序产品,包括计算机程序/指令,其中,所述计算机程序/指令被处理器执行时实现如上所述的方法。
15、根据本发明的一个方面,提供一种存储有程序指令的可读存储介质,当该程序指令被计算设备读取并执行时,使得该计算设备执行如上所述的算力资源访问方法。
16、根据本发明的技术方案,提供了一种算力资源访问方法,注册服务器获取各个算力提供设备发送的算力提供设备的资源访问信息和资源使用状态信息,接收客户端经由代理服务器发送的目标算力资源访问请求,并确定目标算力资源对应的多个算力提供设备,基于目标算力资源对应的各个算力提供设备的资源使用状态信息,来从中确定空闲算力最高的预定数量个算力提供设备,进而,将最近预定时间内接收到的多个目标算力资源访问请求均匀分发至预定数量个算力提供设备,并确定客户端的目标算力资源访问请求对应的目标算力提供设备,将目标算力提供设备的目标资源访问信息发送至代理服务器,以便代理服务器基于目标资源访问信息访问目标算力提供设备提供的目标算力资源,进而将目标算力资源提供至客户端使用。基于此,能够实现多种算力资源的互联联通,使用户能够一站式访问多种算力资源,且能够根据算力使用情况对算力资源进行动态调度,将访问请求导流到空闲算力提供设备上,提高了算力资源利用率。而且,用户无需考虑算力资源底层的通信细节。
17、进一步地,如果目标队列中的任一算力提供设备信息对应的访问请求清单中的访问请求数量超过预定阈值,注册服务器会将该任一算力提供设备信息移至目标队列的队尾。基于此,能够进一步保证访问请求较少的算力提供设备能够被使用,实现向空闲算力提供设备导流,进一步提高算力资源利用率。
18、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
1.一种算力资源访问方法,在注册服务器中执行以访问多种算力资源,所述注册服务器与代理服务器、每种算力资源分别对应的多个算力提供设备通信连接,所述代理服务器与一个或多个客户端通信连接,所述方法包括:
2.如权利要求1所述的方法,其中,确定空闲算力最高的预定数量个算力提供设备,包括:
3.如权利要求2所述的方法,其中,每种算力资源分别对应一个消息通道;获取各个所述算力提供设备发送的所述算力提供设备的资源访问信息和资源使用状态信息,包括:
4.如权利要求3所述的方法,其中,还包括:
5.如权利要求1-4中任一项所述的方法,其中,还包括:
6.如权利要求5所述的方法,其中,还包括:
7.如权利要求1-4中任一项所述的方法,其中,目标算力资源访问请求中包含目标通信协议信息;
8.如权利要求1-4中任一项所述的方法,其中,接收客户端经由代理服务器发送的目标算力资源访问请求,包括:
9.如权利要求1-4中任一项所述的方法,其中,所述多种算力资源包括智算算力资源、超算算力资源和通算算力资源。
10.如权利要求3所述的方法,其中,获取各个所述算力提供设备发送的所述算力提供设备的资源访问信息和资源使用状态信息,还包括:
11.一种算力资源访问系统,用于访问多种算力资源,所述系统包括:
12.一种计算设备,包括:
13.一种计算机程序产品,包括计算机程序/指令,其中,所述计算机程序/指令被处理器执行时实现如权利要求1-10中任一项所述的方法。
14.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并处理时,使得所述计算设备处理如权利要求1-10中任一项所述的方法。