全球观焦点:赛道Hyper|英伟达超算机:定义AGI算力集群
英伟达创始人兼CEO黄仁勋,不但是个出色的技术工程师,也是位杰出的市场管理专家和营销大师。
黄仁勋的营销才能,从其对GPU的定义可以窥视。原先,GPU只是一张显卡,后来黄仁勋将服务器也称为GPU。最近,“黄氏”GPU定义,已扩展至CPU叠加GPU内存算力集群。
【资料图】
英伟达最近发布的超级计算机DGX GH200,从参数上看,性能极为惊人,结构也堪称精巧。但是,从技术原理上看,DGX GH200原本很可能并非为AI集训所设计,其内核Grace Hopper是决策型AI(为AI推荐系统所用)性质。
从结构设计上看,DGX GH200从决策型AI“转型”到LLM方向,但其真正价值并非为LLM定制,而是其可扩展性、以及将CPU内存与GPU内存,通过NVLINK C2C组件整合起来的技术,从而实现黄仁勋将GPU的定义扩展为超算集群的逻辑自洽。
至于真正的为LLM定制的针对性综合解决方案,黄仁勋还没给出答案。
CPU+GPU=?
DGX GH200的核心是Grace Hopper(CPU+GPU)。每台DGX GH200,都搭载了多达256个Grace Hopper。
黄仁勋将Grace Hopper称为“superchip”(超级芯片),这很像是一种营销表达。
实际上,Grace是CPU,确实是为AI而生,但本身的技术特性不是高性能CPU算力,而是能耗控制。换句话说,Grace负责还过得去的算力性能;Hopper则是GPU,与印象中的英伟达GPU负责AI算力不同,“Grace Hopper”中的Hopper,负责的是散热。
根据英伟达技术白皮书显示,Hopper是英伟达基于Hopper架构的GPU(即H100系列),而Grace则是英伟达自研的基于ARM架构的高性能CPU。
这颗芯片的CPU核(core)型号是Arm的公版neoverse N2。根据英伟达在2021年发布Grace Hopper时的PPT信息,Grace是一款包含了76个CPU核的N2多核处理器。
通过LPDDR5X(内存)通信接口,Grace接了高达512GB的内存(实际480GB),内存带宽也达到546 GB/s;Hopper(GPU)则通过HBM3(显存)接口接了最多96GB的显存,带宽可达3TB/s。
LPDDR,即Low Power Double Data Rate,中文全称“低功耗双倍数据速率”,是美国JEDEC固态技术协会(JEDEC Solid State Technology Association)面向低功耗内存制定的通信标准。
LPDDR有时候也等同于Low Power Double Data Rate SDRAM,中文全称“低功耗双信道同步动态随机存取内存”。通常,这以先进封装技术直接堆在CPU处理器上方,以低功耗和小体积著称,是移动应用场景的主流内存产品。
2019年2月,JEDEC发布JESD209-5,即LPDDR5低功耗内存传输速率(通信)标准。相较于2014年发布的第一代LPDDR4标准,LPDDR5的I/O速度提升到6400 MT/s,实现翻番。
基于LPDDR5的性能基础,LPDDR5X更进一步:数据传输速率从6400Mbps增至8533Mbps,对于支持8533Mbps LPDDR5X内存的移动SoC,其峰值理论可用带宽将进一步增长到68.26GB/s,从而赋予更广泛的设备拥有更多基于AI和5G的功能。
Grace用了LPDDR5X,就其16GB的容量而言,即使用了8片,CPU的总容量也只有128GB,远远达不到决策AI所需要的存储空间,更遑论对LLM的容量支持要求。但黄仁勋采用了新的结构,也就是集成8颗Grace CPU,还将之互联成一个Unified Memory。
这时,内存容量就高达1TB(8*128G),等于用X86的2S结构,相当于512GB per Socket的1TB容量。
回到Grace Hopper超级芯片,其高达144TB的Memory(显存)量,实际上是LPDDR5X的内存叠加HBM3的显存,即256组的CPU 480GB内存(LPDDR5X)叠加GPU 96GB显存(HBM3)。简单折算下,就是每个节点8组搭配,约3.75TB的CPU内存加上768GB的显存。
乍看上去,如此神一样存在的存储容量令人惊叹。但实际上,Grace Hopper的整体容量,除了内存还包括显存,这是从所未见的结构设计。但这种结构忽略了CPU同样令人惊奇的延迟。
这问题该怎么解决?若解决不了,以Grace Hopper为核心的DGX GH200,速度比蜗牛还慢,还怎么训练AI?
因此,杰出的技术工程师黄仁勋,在Grace Hopper中,还应用了至关重要的组件“NVLink C2C”。这个组件的核心是NVLink通信协议,将Grace的CPU与Hopper的GPU之间传输数据量的带宽,以900GB/s的带宽速率联系起来,远超常规的64GB/s带宽速率。
这就是黄仁勋敢于将LPDDR5X内存的CPU容量算到DGX GH200超算机整体存储规格的底气。虽然叠加高容量CPU内存会带来超级延迟的不利后果,但GPU对延迟并不敏感,通过以NVLINK通信协议为核心的NVLINK C2C组件,将CPU的内存变成了GPU内存,以此消除高容量CPU内存带来的延迟。
这种结构和部件设计,也是DGX GH200超算机引以为傲的可扩展性特征。
价值和不足
DGX GH200超算机的性能取决于存储空间的大小。144TB还能扩展吗?当然可以。这可通过将Grace Hopper与英伟达Bluefield DPU的接口连接InfiniBand,这样就可进一步扩展到更大的规模,从而实现更高性能的计算。
虽然看上去有144TB超级内存空间,900GB/s的传输速率也相当牛逼,但平均下来每组Grace Hopper的带宽也就200GB/s,与144TB共享显存带宽差太远。
总体来说,对DGX GH200超算机的性能来说,Grace Hopper芯片组的结构设计是关键,而英伟达的NVLink协议具有的超高性能数据互联能力是关键中的关键,核心中的核心。通过提供高达900GB/s的带宽并且提供一致性接口,Grace Hopper实现强悍的可扩展性。
Grace Hopper中CPU与其他高性能服务器端ARM CPU的区别,也许就是对于NVLink接口的支持,而这也成了Grace Hopper的最显著亮点。
虽然英伟达发布的DGX GH200超算机,其内核Grace Hopper的结构设计和软件超高速一致性内存接口NVLink的奇思妙想,并非是对AGI做的针对性整体解决方案。但是,黄仁勋的技术和结构设计能力肌肉秀,真正的价值是对处于AI生成式技术和应用阶段,对具有超强性能的算力集群产品做出符合AGI阶段的标准定义。
这里可能需要简单解释下为什么DGX GH200超算机不是为AGI做出的针对性解决方案,而是主要面向决策式传统AI的推荐系统。
首先,DGX GH200超算机的核心结构Grace Hopper芯片组发布于2021年。那时虽然AGI也在迭代中,但远远没有像2022年12月OpenAI发布的ChatGPT-3.5这种现象级应用带来的轰动效应,因而也没有像现在这样全球范围内的广泛关注度。
其次,从技术原理看,传统AI决策型推荐系统的特点是内存占用大,但计算数据要转换的热数据(指频繁访问的在线类Data)并不多。因此,通行的做法是,通过系统设计,在CPU内存中临时存放热数据,再以GPU侧的HMB显存做cache并导入热数据,对带宽和CPU内存速度要求不高。
大模型的数据转移特征是什么?内存占用也不小,但每次计算来回流动的基本是热数据,少有数据集之类的冷数据。所以就两难,若选择将海量热数据放到LPDDRX5,带宽还是有点不够(毕竟每组Grace Hopper带宽也只有200GB/s);若放冷数据,成本又太高。
这里还有个问题,就是维护成本极高。Grace Hopper就物理形态看,CPU和GPU还各自独立,这两种芯片互联使用的是PCB板上的走线。在技术逻辑角度,这两种物理芯片的存储空间通过NVLink C2C组件和NVLink协议,被集成为一个整体。
因此,高度集成的Grace Hopper,但凡坏一块LPDDR5X,整个芯片组就要报废。这样的维护成本,除了巨头比如微软和谷歌这种不差钱的公司,其他公司都难以承受。
综合来说,Grace Hopper的LLM应用,在DGX GH200超算机的技术丛集中,并没有显现出惊艳的亮点;其结构设计确实表现出色,但这很像是以LLM需求所做的微调。因为这个结构,发布于2021年,那时LLM应用方向也还并不向今日这样如此明确。
标签:
上一篇:热门:雅创电子:截至本公告日 谢力书累计质押股数为280万股
下一篇:最后一页
- 全球观焦点:赛道Hyper|英伟达超算机:定义AGI算力集群
- 热门:雅创电子:截至本公告日 谢力书累计质押股数为280万股
- 抖音音乐推广任务赚钱吗?如何接抖音音乐推广任务?
- 每日观点:云南易门农商银行被罚50万:因违规收费等
- 二连出入境边防检查站举办警营开放日活动
- 二季度收官展望 零跑加速迭代领跑新能源大众化|每日速递
- 每体:巴萨希望继续削减工资支出,将清洗五名外租球员
- 绿地香港:前5月合约销售金额66.47亿元
- 《暗黑破坏神4》干燥平原祭坛位置全介绍 干燥平原莉莉丝祭坛攻略
- 海信hisense hisense是什么牌子
- 天天新资讯:2023端午天津儿童剧灰姑娘观演指南
- 环球新消息丨it行业变化快_什么是IT行业 是做什么的
- 2023洛阳端午节放假通知(2023洛阳端午节放假通知图片)
- 天龙八部智能助手脚本怎么设置_天龙八部智能助手脚本|世界播资讯
- 北京通州网红麦田开始收割,出地铁就能看到风吹麦浪
- 中国gdp位居世界第三仅次于美国和日本对吗(中国gdp位居世界第三仅次于美国和日本)
- “碳关税”来了,可能影响上千亿贸易!中国企业怎么办? 天天动态
- 梅西直播共露脸50秒 且是提前录制的视频
- 有乘客在车上晕倒 司机乘客合力5分钟将其送到医院 焦点信息
- 西风的话歌词打印(西风的话歌词) 每日热议
- 天天看点:全球氯化钾需求恢复 价格或继续下跌
- GOAT德约斩获生涯第23座大满贯&3圈大满贯第一人-当前信息
- 世界观速讯丨研究人员发布Windows高危漏洞的概念验证程序 可以获得SYSTEM权限
- 2024年湖北工业大学工程技术学院专升本招生简章
- 日本染发剂纯天然排名第一 日本染发剂纯天然排名|天天快讯
- 百旺开票显示操作未授权怎么办_百旺开票
- 御史中丞是几品(御史中丞)-焦点速读
- 民调:因“密件门”被起诉后,特朗普仍在共和党候选人中领跑
- 关爱女童成长成才,中国儿基会和腾讯成立5000万元专项基金 全球速讯
- 联想小新 Pro 超能本 2023 系列酷睿版最高直降 700 元-环球资讯
- 即时焦点:日本核污水排海时间临近 韩国增加放射物检测设备加强海产监测
- 今日聚焦!成都小升初大摇号报名可以报几所学校2023?
- 新能源车驱动系统第一股,前10大股东持股占比达73%,股价拦腰斩断_微头条
- 贵州发布2023年度省十件民生实事1至4月推进情况-世界观天下
- 执业药师证报考资格条件
- 资讯推荐:三大运营商大量客户称“被贷款”,免费礼成了“信用购”?
- 国铁集团发布严正声明-全球快资讯
- 生命富贵宝年金保险怎么样?提供生存金吗?
- 阿贾克斯_AJ麦克林
- 26岁成中国最年轻女富豪,如今她正式接管家族投资-天天报道
- 当前播报:招银国际:维持京东方精电(00710)“买入”评级 目标价23.69港元
- 不动产权证电子证书,如何领取看这里! 环球快报
- 每日资讯:两市ETF两融余额减少3.1亿元
- 全球聚焦:【学思想 强党性 重实践 建新功】农田高标准 “饭碗”端得稳——孝感建设高标准农田403万亩
- 沪深港通数据监测2023年06月12日_信息
- 北京城市学院贴吧 天天滚动
- 商用四年,中国5G走向“无人区” 世界独家
- 热带雨林迁移农业是什么意思(热带雨林迁移农业) 资讯推荐
- 金信英吧_金信英
- 固体药品存放在什么里使用固体药品一边用(固体药品存放在)
-
焦点报道:ttl逻辑电平_ttl电平是什么意思
1、很难说清楚,不过,你可以去找本数字电路的教材。2、去参考上面的扇
-
第53届亚太桥牌锦标赛开赛
新华社北京6月9日电中国桥牌协会消息,第53届亚太桥牌锦标赛9日在香港
-
即将举行!成都大运会火炬传递启动仪式来啦
第31届世界大学生夏季运动会将于7月28日至8月8日在成都举行,这是我国
-
华润集团发声明:“海外华润CRC”等非集团投资公司 天天速读
6月9日,华润(集团)有限公司发布声明称,近日,公司发现有商号以“顶
-
我是大运火炬手丨第一棒火炬手邹敬园:我在成都等你们_世界速读
这是我第一次担任火炬手,倍感荣幸与光荣!邹敬园对即将到来的大运会,
-
世界滚动:“两展一节”在京启动,北京茶业交易中心平台预计年底运行
6月9日-6月12日,2023北京国际茶业展、北京马连道国际茶文化展、绍兴茶
-
精彩看点:国几的车子怎么看(国几的车在哪里可以显示?)
相信大家对国几的车子怎么看,国几的车在哪里可以显示?的问题都很疑惑
-
72岁TVB知名老戏骨宣布结婚,两人的婚事获得女方父母的首肯
近日,在“亚洲电视66周年台庆”活动现场,今年72岁的老戏骨李龙基受访
-
苍穹巨灵·内蒙古篇
莽莽苍苍的林海雄浑壮阔的沙漠奔流不息的黄河水一望无垠的大草原……辽
-
天天播报:江苏海洋大学教务管理系统官网_江苏海洋大学教务管理系统
1、是国家的规定每个系的收费标准都不一样。本文就为大家分享到这里,
-
厦门推出今年第二批商住用地 计划本月底拍卖出让
昨日,厦门市自然资源和规划局发布公告,计划于6月30日拍卖出让2023年
-
要闻:喝红酒配什么小吃合适?
用红酒吃什么:淡红葡萄酒适合食用清淡的海鲜,鱼子酱,清淡的奶酪,沙
-
三思而后行英语俗语_三思而后行英语
1、“三思而后行!”用英文可以这么说:2、Thinktwicebeforeyouact!3、Thinkcare
-
广西启动2023年普通高校毕业生就业百日攻坚行动
近日,自治区人力资源社会保障厅、自治区教育厅联合印发通知,部署开展
-
文字转真人声音(文字转人声软件免费)
来为大家解答以上的问题。文字转真人声音,文字转人声软件免费这个很多
-
建设银行积分商城官网(建设银行积分商城) 当前动态
来为大家解答以上的问题。建设银行积分商城官网,建设银行积分商城这个
-
什么叫上二垒下三垒_什么叫上二垒
1、上二垒的意思:棒球比赛中,跑到了二垒的位置上。2、2、男孩和女孩
-
全球快资讯:四川一中学不让学生带书离校售卖,“校内3毛/斤,校外6毛/斤”,县教育局回应
据猛犸新闻报道,6月9日,在四川广安,有网友发视频称,高考结束,邻水
-
环球热文:东昌府区又将新建一所职业学校 !总建面约计4.2万㎡
聊城市智能职业技术学校项目招标公告本项目聊城市智能职业技术学校项目
-
天天视点!离线空间资源(离线空间)
来为大家解答以上的问题。离线空间资源,离线空间这个很多人还不知道,
-
金秋十月的优美句子(金秋十月什么十一月) 全球独家
1、十二月别称有:一月一月:通常称:正月、柳月、端月、初月、嘉月、
-
全球播报:《蜘蛛侠:纵横宇宙》明年确定完结,没有第四集
正在热映中的《蜘蛛侠:纵横宇宙》虽然长达140分钟,但故事并未讲完,
-
新动态:5月国内挖掘机销量降46%,出口增速重回两位数|基建晴雨表
界面新闻记者|马悦然今年以来,国内挖掘机销量持续同比下滑。6月7日晚
-
三亚什么地方好吃的多便宜?|焦点热门
三亚天涯亿恒主题夜市有很多好吃的,位于解放四路1361号。那里吃东西和
-
速读:厦门计划招募555例患者进行临床研究 推动慢阻肺早防早治
昨日上午,中重度慢阻肺患者规范化呼吸康复项目第二阶段培训会在海沧正
-
哥伦比亚政府与“哥伦比亚民族解放军”签署有期限停火协议_焦点热门
当地时间6月9日中午,哥伦比亚政府与反政府武装“哥伦比亚民族解放军”
-
特别观察丨这样一条街 点亮一座“城” 世界热头条
特别观察丨这样一条街点亮一座“城”原标题:特别观察丨这样一条街点亮
-
饮酒配什么蔬菜好吃?
饮酒分分冬天和夏天,夏天喝酒喜欢啤酒,啤酒跟什么最搭呢,当然是烧烤
-
a4四折页标准尺寸_四折页尺寸多少 环球短讯
1、四折页的国际标准尺寸为:380mm*210mm。2、在四折页的印刷过程中,
-
今晚20:00起至运营结束,南昌地铁全线网免费乘车
今晚20:00起至运营结束,南昌地铁全线网免费乘车来源|都市现场原创未
-
足字旁如何打出来(足字旁怎么打出来) 全球热闻
1、一、足的声母z,韵母u,音调zú二、释义:脚:~下(对对方的敬称)
-
每日资讯:《黑暗荣耀》郑星一将演出古装电影新作《战,乱》,与车胜元、朴正民、姜栋元合作
因演出《黑暗荣耀》系列而大受瞩目的性格男星郑星一,下一部作品备受期
-
三星折叠屏W24系列通过认证:Fold5和Flip5换皮版,标配25W快充|天天播资讯
根据最新的消息,三星“心系天下”版W24已通过3C认证,型号分别为SM-W9
-
【播资讯】极目时评丨环卫母亲与高考儿子相拥而泣刷屏,普通人改变命运的努力打动人心
6月8日,河北定州市高考英语科目结束,一位身穿环卫服的母亲在考场外等
-
2023高考今日落幕,多地公布志愿填报时间_今日视点
中新网北京6月10日电(韦香惠)10日,2023全国高考将全部落幕,目前,全国多
-
12岁姑娘被查出肺结核!医生提醒:这病好发于年轻女性 今头条
潮新闻客户端记者何丽娜通讯员夏泽海近期,12岁的姑娘小李(化名)染上
-
魔域按键精灵脚本制作流程(魔域按键精灵脚本)-天天热资讯
1、没有物品宝宝存仓库,有的可以自己增加一下 VBSdimtp(16),a,x,y,line
-
当前播报:部分交友软件仍对未成年人“不设防”
多个社交App,在用户未进行“实名认证”的情况下,仍可正常使用。业内
-
一般行政责任的构成要件有什么
一、一般行政责任的构成要件有什么行政责任的一般构成要件:1、存在违
-
世界信息:北京门头沟举办“文化和自然遗产日”非遗宣传展示活动
千龙网讯6月9日上午,在2023年中国“文化和自然遗产日”到来之际,由门
-
昔日荒山变为幸福“金山” 桃园变成农民增收“致富园”
央视网消息:贵州省铜仁市思南县的大河坝镇位于武陵山腹地,在脱贫攻坚
-
世界观焦点:河南:关于做好2023年军队院校招收普通高中毕业生政治考核工作的通知
为做好我省2023年军队院校招收普通高中毕业生政治考核工作,现将有关事
-
“鄂汇办”APP襄阳旗舰店上线开锁服务-世界新视野
【来源:襄阳日报客户端】“多亏了‘鄂汇办’APP襄阳旗舰店的开锁服务
-
中国人事考试网_中国十大时尚摄影师
1、陈漫2、目前国内最具影响力的时尚摄影师,日薪十万的国际大牌御用摄
-
当前快看:苹果M2 Ultra在Geekbench 5跑分并没有碾压英特尔、AMD,还不如i9-13900K
在这次WWDC23上面,苹果不算太意外地带来2023款MacPro,最主要的卖点就
-
世界热议:一台无人机相当于25名工人,江陵县水稻种植运用无人机撒播
一台无人机相当于25名工人,江陵县水稻种植运用无人机撒播---25名插秧
-
环球实时:OpenAI首席执行官同韩总统会面:建议韩国增加系统芯片产能 放宽规制营造AI生态系统
韩联社9日消息,韩国总统尹锡悦9日下午在龙山总统府接见OpenAI首席执行
-
头狼:黄金下周1970-73区域布局空
隔夜黄金还是涨不动1973布局空昨天黄金就是闪现到1973附近但显然还是缺
-
发展中国家能源发展与产业政策研修班在兰开班-全球资讯
发展中国家能源发展与产业政策研修班在兰开班
-
专访金元浦:从“拎着走”到“沉浸式”,文化与科技融合将产生倍数效应
南方财经全媒体记者吴治聪陈思琦深圳报道6月7日,中国人民大学文化创意
X 关闭
X 关闭