“中国芯”迎来重大突破!发布首款通用GPU芯片,创全球算力新纪录

8月9日下午,来自上海的年轻企业壁仞科技正式发布BR100系列GPU。

壁仞科技在位于闵行临港浦江国际科技城的公司总部,发布了首款通用GPU芯片BR100,创出全球算力纪录,16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别,打破了此前一直由国际巨头保持的通用GPU全球算力纪录。

峰值算力达国际厂商旗舰产品3倍以上

据壁仞科技介绍,公司首款通用GPU芯片产品BR100芯片创出全球算力纪录,峰值算力达到国际厂商在售旗舰产品3倍以上,创下国内互连带宽纪录,还是国内率先采用Chiplet技术、率先采用新一代主机接口PCIe 5.0、率先支持CXL互连协议的通用GPU芯片。

壁仞科技创始人、董事长、CEO张文表示,BR100的正式发布,标志着全球通用GPU算力纪录第一次由一家中国企业创造,中国的通用GPU芯片正式迈入“每秒千万亿次计算”新时代。

主要参数方面,BR100系列采用7nm制程,集成770亿晶体管,基于壁仞科技自主原创的芯片架构开发 ,采用Chiplet(芯粒)、2.5D CoWoS等先进的设计、制造与封装技术,可搭配64GB HBM2E显存,超300MB片上缓存,支持PCIe 5.0、CXL互联协议等。

BR100之所以能够实现国际领先的算力,最底层的支撑来源于自主原创的芯片架构——壁立仞。壁仞科技联合创始人、CTO洪洲说,壁立仞架构以数据流为中心,对数据流进行深度的优化,通过六大技术特性,比较完整地解决了数据搬移的瓶颈和并行度不足的问题,使得BR100芯片在给定的工艺下实现了性能和能效的跨越式进步。

为达到超大算力,对芯片设计的工艺要求极高。洪洲透露,BR100采用了Chiplet设计理念,让芯片总面积可以突破光罩尺寸对单芯片面积的限制,集成更多的算力和通用性逻辑;此外,通过缩小单个计算芯粒的面积,还可以同时提升产能与良率,进而极大地降低硅片的成本,并支持更灵活的产品策略。

发布会上,壁仞科技还发布了创造全球性能纪录的OAM服务器——海玄,以及OAM模组——壁砺100,PCIe板卡产品——壁砺104,和自主研发的BIRENSUPA软件平台。

此外,为了更好地服务全球开发者,壁仞科技开发者云也已经正式上线。壁仞科技希望通过社会各界开发者的共同努力,形成聚沙成塔的力量,共同推动中国半导体技术的发展,真正做到让更多人从技术发展中受益。

清华大学电子工程系长聘教授、系主任汪玉表示,算力对于数字世界、物理世界的融合和共同发展,具有巨大的作用。建立国产的GPGPU和AI芯片的生态非常重要。“如果能建立一个相对统一的生态,让更多的用户进行这个编程和应用,对芯片的厂商,将是一个重大的利好。”