“中国芯”迎来重大突破！发布首款通用GPU芯片，创全球算力新纪录

8月9日下午，来自上海的年轻企业壁仞科技正式发布BR100系列GPU。

壁仞科技在位于闵行临港浦江国际科技城的公司总部，发布了首款通用GPU芯片BR100，创出全球算力纪录，16位浮点算力达到1000T以上、8位定点算力达到2000T以上，单芯片峰值算力达到PFLOPS级别，打破了此前一直由国际巨头保持的通用GPU全球算力纪录。

峰值算力达国际厂商旗舰产品3倍以上

据壁仞科技介绍，公司首款通用GPU芯片产品BR100芯片创出全球算力纪录，峰值算力达到国际厂商在售旗舰产品3倍以上，创下国内互连带宽纪录，还是国内率先采用Chiplet技术、率先采用新一代主机接口PCIe 5.0、率先支持CXL互连协议的通用GPU芯片。

壁仞科技创始人、董事长、CEO张文表示，BR100的正式发布，标志着全球通用GPU算力纪录第一次由一家中国企业创造，中国的通用GPU芯片正式迈入“每秒千万亿次计算”新时代。

主要参数方面，BR100系列采用7nm制程，集成770亿晶体管，基于壁仞科技自主原创的芯片架构开发，采用Chiplet(芯粒)、2.5D CoWoS等先进的设计、制造与封装技术，可搭配64GB HBM2E显存，超300MB片上缓存，支持PCIe 5.0、CXL互联协议等。

BR100之所以能够实现国际领先的算力，最底层的支撑来源于自主原创的芯片架构——壁立仞。壁仞科技联合创始人、CTO洪洲说，壁立仞架构以数据流为中心，对数据流进行深度的优化，通过六大技术特性，比较完整地解决了数据搬移的瓶颈和并行度不足的问题，使得BR100芯片在给定的工艺下实现了性能和能效的跨越式进步。

为达到超大算力，对芯片设计的工艺要求极高。洪洲透露，BR100采用了Chiplet设计理念，让芯片总面积可以突破光罩尺寸对单芯片面积的限制，集成更多的算力和通用性逻辑；此外，通过缩小单个计算芯粒的面积，还可以同时提升产能与良率，进而极大地降低硅片的成本，并支持更灵活的产品策略。

发布会上，壁仞科技还发布了创造全球性能纪录的OAM服务器——海玄，以及OAM模组——壁砺100，PCIe板卡产品——壁砺104，和自主研发的BIRENSUPA软件平台。

此外，为了更好地服务全球开发者，壁仞科技开发者云也已经正式上线。壁仞科技希望通过社会各界开发者的共同努力，形成聚沙成塔的力量，共同推动中国半导体技术的发展，真正做到让更多人从技术发展中受益。

清华大学电子工程系长聘教授、系主任汪玉表示，算力对于数字世界、物理世界的融合和共同发展，具有巨大的作用。建立国产的GPGPU和AI芯片的生态非常重要。“如果能建立一个相对统一的生态，让更多的用户进行这个编程和应用，对芯片的厂商，将是一个重大的利好。”