基于扩展存储器的单一GPU芯片架构系统的制作方法

专利2025-12-20  19


本发明涉及芯片,尤其涉及一种基于扩展存储器的单一gpu芯片架构系统。


背景技术:

1、现有的图形处理器(graphics processing unit,简称gpu)芯片的多级缓存架构中,受限于gpu芯片的面积、布局等因素,每一级高速缓冲存储器的容量受限。以三级缓存为例,第一级高速缓冲存储器、第二级高速缓冲存储器和第三级高速缓冲存储器等的存储容量有限,无法实现灵活扩充第一级高速缓冲存储器、第二级高速缓冲存储器和第三级高速缓冲存储器的存储容量。现有技术中,第三级高速缓冲存储器通常设置在第二级高速缓冲存储器与gpu显存的通路之间,第二级高速缓冲存储器需要从第三级高速缓冲存储器获取数据,当每一级缓存容量小于计算所需的数据集大小时,数据缓存需要频繁切换,而频繁切换的开销以及慢速的gpu显存读写会降低gpu的数据访问效率,从而导致gpu性能变差。

2、由此可知,如何提出一种新的gpu架构,提高gpu的数据访问速度、提升gpu芯片的性能成为亟待解决的技术问题。


技术实现思路

1、本发明目的在于,提供一种基于扩展存储器的单一gpu芯片架构系统,提高了gpu的数据访问速度,提升了gpu芯片的性能。

2、根据本发明一方面,提供了一种基于扩展存储器的单一gpu芯片架构系统,包括gpu芯片和覆盖在gpu芯片上的扩展存储器,所述gpu芯片和所述扩展存储器采用晶圆堆叠的方式切割生成,所述gpu芯片和所述扩展存储器的面积和形状均相同。

3、所述gpu芯片包括m个执行单元{a1,a2,…,am,…am}、m个第一级高速缓冲存储器{c11,c12,…,c1m,…,c1m}和n个第二级高速缓冲存储器{c21,c22,…,c2n,…,c2n},其中,am为gpu芯片中的第m个执行单元,c1m为gpu芯片中的第m个第一级高速缓冲存储器,c1m设置在am中,m的取值范围为1到m;c2n为gpu芯片中的第n个第二级高速缓冲存储器,n的取值范围为1到n;每一个c1m均能够访问任何一个c2n。

4、所述gpu芯片包括第一芯片区域和第二芯片区域,所有am和c1m均设置在所述第一芯片区域中,所有c2n均设置在所述第二芯片区域中。

5、所述第二芯片区域还设置有n个第一接口,每一c2n对应一个第一接口,所述扩展存储器包括r个扩展存储单元,r≥n,所述扩展存储单元包括第二接口,每一所述第二级高速缓冲存储器对应一个扩展存储单元,c2n对应的第一接口与对应的扩展存储单元的第二接口相连,所有与第一接口相连的第二接口在所述gpu芯片上的投影均位于所述第二芯片区域,c2n对应的扩展存储单元设置为c2n对应的第三级高速缓冲存储器c3n。

6、本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种基于扩展存储器的单一gpu芯片架构系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:

7、本发明通过在gpu芯片上设置扩展存储器,扩大了第三级高速缓冲存储器和第二级高速缓冲存储器容量,提高了gpu的数据访问速度和有效带宽、提升了gpu芯片的性能。

8、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。



技术特征:

1.一种基于扩展存储器的单一gpu芯片架构系统,其特征在于,

2.根据权利要求1所述的系统,其特征在于,

3.根据权利要求1所述的系统,其特征在于,

4.根据权利要求3所述的系统,其特征在于,

5.根据权利要求3所述的系统,其特征在于,

6.根据权利要求5所述的系统,其特征在于,

7.根据权利要求5所述的系统,其特征在于,

8.根据权利要求1所述的系统,其特征在于,


技术总结
本发明涉及一种基于扩展存储器的单一GPU芯片架构系统,包括GPU芯片和覆盖在GPU芯片上的扩展存储器,GPU芯片和扩展存储器采用晶圆堆叠的方式切割生成。所述GPU芯片包括M个执行单元A<subgt;m</subgt;、第一级高速缓冲存储器C<supgt;1</supgt;<subgt;m</subgt;和N个第二级高速缓冲存储器C<supgt;2</supgt;<subgt;n</subgt;,C<supgt;1</supgt;<subgt;m</subgt;设置在A<subgt;m</subgt;中,每一个C<supgt;1</supgt;<subgt;m</subgt;均能够访问任何一个C<supgt;2</supgt;<subgt;n</subgt;。所述GPU芯片包括第一芯片区域和第二芯片区域,所有A<subgt;m</subgt;和C<supgt;1</supgt;<subgt;m</subgt;均设置在所述第一芯片区域中,所有C<supgt;2</supgt;<subgt;n</subgt;均设置在所述第二芯片区域中。C<supgt;2</supgt;<subgt;n</subgt;对应的扩展存储单元设置为C<supgt;2</supgt;<subgt;n</subgt;对应的第三级高速缓冲存储器C<supgt;3</supgt;<subgt;n</subgt;。本发明提高了GPU的数据访问速度,提升了GPU芯片的性能。

技术研发人员:请求不公布姓名
受保护的技术使用者:沐曦集成电路(上海)有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1825656.html

最新回复(0)