“百模大战”下算力租赁需求猛增,超算架构为大模型训练提速
“百模大战”下大模型算力需求猛增。北京超级云计算中心计划今年下半年起陆续上线3万余张满足大模型训练场景用的GPU卡,搭建超算架构大模型算力矩阵;并组建一支7×24小时技术服务团队。“在未来的市场竞争上,谁能把可用的资源变成好用的资源,谁就会在市场上胜出。”
北京超级云计算中心机房。
(资料图片)
算力是当代生产力,超级计算也被称为高性能计算,同时使用几十台甚至几千台服务器这样庞大的算力资源共同完成一个计算任务。人工智能大模型的爆发让算力需求陡增。
“目前主流的大模型训练是超算使用模式,超算相比云计算更加贴合大模型训练场景,服务器之间的计算带宽配比更大,是目前主流云计算环境中的计算网络带宽的数十倍,数据传输效率要求更高。”2023世界人工智能大会期间,北京超级云计算中心CTO甄亚楠对澎湃科技表示,北京超级云计算中心当前可调度超100万CPU核心、超2万张基于超算架构的大模型GPU算力卡。今年下半年起,北京超级云计算中心计划陆续上线3万余张适用大模型训练场景用的GPU卡,满足国产大模型研发需求,构建算力生态。
北京超级云计算中心(下称“北京超算”)成立于2011年,是在北京市人民政府指导下“院市”共建的国家重要信息化基础平台,坐落于北京市怀柔综合性国家科学中心怀柔科学城,成立之初主要为北京市提供在线算力资源,已在北京、内蒙古、宁夏布局三大算力枢纽。
计划陆续上线超3万余张GPU满足大模型训练
算力是人工智能大模型训练的核心生产力,GPT-4等大模型成功的背后有着万张训练卡的计算资源支撑,大模型爆发直接带来了算力需求陡增。北京超级云计算中心营销总监王永旭切身感受到了大模型爆发带来的“颠覆性”算力业务。在大模型兴起前,他所在的单位算力客户小而散,以科研院所为主;大模型流行后,AI算力需求猛增,客户主要为AIGC(生成式人工智能)企业,“ChatGPT的盛行为市场打了一剂强心针。”
北京超级云计算中心CTO甄亚楠。
北京超级云计算中心CTO甄亚楠介绍,“从客户需求情况来看,现在大模型单次训练任务基本上都需要几百张甚至几千张GPU卡做计算加速,同时需要长周期、稳定可靠的计算环境,保障计算任务不中断。”他表示,相对于大型科技公司,科研院所和初创企业的资金实力较弱,建设算力中心的投入高,因此平衡算力成本是重要考量。如果要新建1000张GPU卡的算力规模,包括服务器、交换机、存储、运营等相关资金投入就需要2亿元甚至更多。与此同时,目前国内仍处于缺卡状态,“各大服务器厂商要拿到新的GPU卡资源,预计供货周期都在半年以上,算力卡供不应求的情况应该会一直持续到至少明年年初。”
市场对于人工智能算力的需求旺盛。甄亚楠表示,北京超算具备天然的“技术基因”,目前可调度超100万CPU核心、超2万张基于超算架构的大模型GPU算力卡。从今年7月起,北京超算计划上线11720余张英伟达A800算力卡,以及19000余张英伟达H800算力卡。总体来看,从今年下半年起,北京超算将总计上线超3万张满足大模型训练场景用的GPU卡。
北京超算将符合推理与训练的算力资源通过云服务方式共享给用户,用户通过租赁方式远程访问算力资源。在甄亚楠看来,这种算力使用方式性价比高,用户无需自建算力中心就能获得稳定可靠的计算资源,节省使用成本,缩短计算时长,提高效率。相对于企业根据产品研发需求自建算力中心形成算力使用的波峰和波谷,算力服务商提供弹性算力,拉平算力需求,不浪费算力资源。
把可用的算力资源变成好用的算力资源
“我们最近看到一些大模型的训练需求,服务器之间的互联网带宽一般要求达到3200Gbps,但主流的云计算服务器之间的网络带宽在200Gbps,相差十几倍。如果环境配置和用户需求无法统一,用户的模型要么跑不起来,要么运行效果大打折扣。”甄亚楠说,目前主流的大模型训练是超算使用模式,比如一个模型需要用数百甚至千张卡连续计算两个月或者更久,超算则是把多台服务器进行统一管理和调度,实现高性能计算。大模型训练正是需要超算这种多台服务器并行的模式,而非传统云计算所采用的虚拟化共享模式。相比云计算,超算更加贴合大模型训练场景,服务器之间的计算带宽配比更大,是目前主流云计算环境中的计算网络带宽的数十倍,数据传输效率要求更高。
根据王永旭的观察,大模型算力客户在选择算力服务商时,主要关注GPU卡的型号、卡间互联、节点间互联、是否为超算架构的物理集群。大模型单次训练需要上百张甚至几千张卡,因此通讯非常重要,它会极大影响训练的速度。用于大模型训练的芯片必须是卡间互联大、节点间互联好的集群,这就好比高速公路畅通无阻、不堵车。
北京超算通过算力预测判断用户真正需要的算力资源,基于算力选型首先保证用户拥有可用的算力资源。甄亚楠表示,在解决可用以后要考虑如何让算力更好用,“我们为用户提供的不是单一技术、单一资源,而是一套满足用户综合发展需求的行业解决方案。通过7×24专家服务、平台预置AI主流框架、常用数据集等方式,满足用户在算力使用中方方面面的需求。”为实现算力资源的好用,北京超算在提供算力资源基础上组建了一支7×24小时技术服务团队,针对模型框架的安装、部署、优化以及长时间运行的保障诉求等提供在线技术支持,让终端用户轻松调度算力资源。
“在未来的市场竞争上,谁能把可用的资源变成好用的资源,谁就会在市场上胜出。”甄亚楠表示,目前北京超算已服务国内超20万用户,包括1000多家企业,并为北京智源人工智能研究院、智谱AI等单位提供大模型预训练所需的基于超算架构的GPU算力资源。
搭建算力网络期望GPU算力全国调度
今年5月,中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,中国10亿参数规模以上的大模型已发布79个。“我们希望以超算架构支撑大模型算力应用,成为超算架构大模型算力领跑者,不管是基于当前的大模型训练,还是未来可能会进一步爆发的模型推理。”甄亚楠表示,在“百模大战”之下,需要分析行业的真正痛点,考虑未来芯片、算力规模、业务场景的发展趋势。
大模型所需的算力分为两类,一类是训练算力,一类是推理算力。训练是一个计算密集型的学习过程,每一次训练可以提升模型的精准度,如果计算结果没有达到预期,就需要调整参数重新训练,直到达到预期。一旦模型精准度达到一定水准后,就会产生推理需求。推理是一个判断过程,基于训练好的模型,每次喂新数据,产生更多的预测结果。
甄亚楠表示,大模型训练的参数多、循环次数多,单次训练的算力需求大,而推理的判断逻辑相对固定,单次算力需求较小,当推理的并发量提升,也会提高推理的算力需求。目前国内大模型仍处于发展初期,大模型企业百舸争流,发力点主要集中在大模型训练上,因此训练算力紧缺。“现在我们面向大模型训练是提供基于超算架构的算力资源,面对推理以及小规模的测试验证,我们也提供基于云计算的算力资源,两条腿走路。”
为了更好地支持人工智能产业发展,王永旭表示,北京超算除了部署算力资源,也在全国搭建算力网络,以实现GPU算力全国调度的目标。此外参与到大模型用户的MaaS(模型即服务)推广中,计划集成算力、模型和用户端数据,为用户提供基于大模型基座的人工智能解决方案。
“中长期内,我们关注国产算力以及国产大模型研发需求,希望构建完善的算力生态,一方面建设满足行业需求的算力资源,提供算力共享、性能评测、应用场景支撑等服务,另一方面推动算力供应多元化,既提供通用GPU芯片,也提供国产芯片,解决供需失衡问题。”甄亚楠表示,北京超算将依托12年超算技术积淀和超算架构大模型算力矩阵,持续领跑大模型算力建设,以超算云服务模式实现海量算力资源随需供应,为大模型训练需求提供一站式解决方案。
稿件来自澎湃科技 作者张静
(免责声明:此文内容为广告,相关素材由广告主提供,广告主对本广告内容的真实性负责。本网发布目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,请自行核实相关内容。广告内容仅供读者参考。)
(责任编辑:刘畅 )标签:
相关阅读
精彩推荐
阅读排行
相关词
- 高温暂缓!河南终止Ⅲ级高温应急响应
- 江西省宜春市袁州区开展“企业商业秘密保护能力提升服务月”活动
- 九州飞凰录兑换码大全 九州飞凰录最新礼包激活码
- 何以中国丨探秘“顶流”博物馆! 一起来陕历博组队“寻宝”
- 逆水寒雁门关机关人位置在哪 雁门关机关人位置介绍
- 国航回应!上海飞北京遇颠簸惊魂一刻!
- 刑事诉讼原告是谁
- 决战平安京弈坐隐春秋怎么样 弈坐隐春秋新皮肤介绍
- 怎么写好小说大纲 怎么写好小说
- 最划算旅行车!豪华品牌/进口/中大型 这新车39.18万起!
- 邻村书记称被浮桥搭建者殴打缝20针 大喊:打死他我去偿命
- (成都大运纪事)成都大运会打造“双碳”先锋赛会 吸引捐赠碳汇39.7万吨
- 创新奇智斩获CVPR 2023 PlantTraits挑战赛世界冠军
- 数字科技让传统文化“活”起来
- 中国移动大模型也来了!运营商们凭什么和OpenAI同场竞技?
- 驰骋大洋!中国航海日看国产“万吨大驱”有多帅
- 上半年国家铁路发送电煤7.77亿吨 同比增长13.1%
- 樊锦诗:我的一生只做了一件事
- 电视剧《梦中的那片海》:坚持“年代”与“青春”的结合
- 输iG后knight高强度排位 十二局9胜3负 70%胜率打至王者1408分
- 中信建投期货7月11日铁合金日报:压力未出清
- 氧化钙什么颜色(各种金属氧化物分别是什么颜色?)
- 逆水寒捕鼠者喵任务怎么做 捕鼠者喵任务攻略
- 绿色、低碳还有各种“蓉宝”周边 成都大运会即将举行
- 湖南涟源:湘中煤海斗笠山 穿越时光迎蝶变
- 电脑提示commoneventlogginglibrary_release.dll文件丢失的解决方法
- 何以中国|饭盒还是热水壶?这件器具三千年前的先民都在用
- 7月份全国自然灾害风险形势发布
- 《国家标准实施指南(2023版)》发布
- 潢川:大力发展稻虾共作 产业助力乡村振兴
- 传统厂房变“摩天工厂” 北京大兴打造世界级氢能应用“样板间”
- 一问“医”答丨今年三伏持续40天!防暑养生这样做
- 红米笔记本玩游戏蓝屏怎么办
- 保定曲阳:迎高温“烤”验 浇灌助力抗旱保苗
- 北京连续七年在中国省市文化产业发展综合指数排名保持第一
- 逆水寒捕鼠者喵任务怎么做 捕鼠者喵任务攻略
- 一池碧水 十里春风
- wkssvc.dll丢失如何自动修复
- 北京:开创首都文旅高质量发展新格局
- 开机dpc watchdog violation蓝屏解决教程
- 三峡电站累计发电超16000亿千瓦时 减少二氧化碳排放量约13.2亿多吨
- 数字化钻井技术加速页岩油勘探开发
- 海南高速(000886.SZ):文昌国际赛车公园项目前期工作在有序进展中
- 低效“烧饼地”盘成千亩高效田 净增耕地超过50亩
- 刚过去的6月是有记录以来最热的6月 “三伏天”今日开启
- 全国天气预报:北方即将退出高温群 四川盆地多雨需防旱涝急转
- 人工智能助力中长期气象预报
- 《原神》3.8限时任务黛依阿的三日遐想方法
- 时隔半年网易《射雕》又测了!一支宣传片彰显开放世界野心
- 江子晨(7.11)—非美低多大赚市场!美联储或再启收割机
- “新一代软件生态图谱”发布
- 又美又飒!女船长任大学副教授,一不小心成“招生简章”
- 不合理开“贵药”、用“贵耗材”……海南全面排查整治医疗腐败!
- 司法部 国家网信办研究审议《未成年人网络保护条例(草案)》
- 2400万元的“计量损失”之谜终获破解 | 广西梧州市市场监管局巧解计量纠纷让“蒙娜丽莎”重绽微笑
- 奔驰宣布支持特斯拉北美充电标准
- 住房和城乡建设部:扎实有序推进城市更新 防止大拆大建
- 煤炭行业首例5G井下 低频大上行方案完成验证
- 欧盟启动单一专利制度 提升创新竞争力
- 黑龙江省鸡西市:打好安全监管“前哨战” 守护旅游市场“升温季”
- 集聚青年人才来苏就业创业 优秀学子开启“菁英汇—名校硕博苏州行”
- 《原神》3.8千奇澴回任务怎么触发
- 今日入伏 头伏哪些地方容易中暑天气如何?
- 2024公务员考试申论必——归纳概括题备考指南
- 原神黛依阿的三日遐想完成方法
- 陷“流动性陷阱”之争!央行增发的钱流向何处?
- 美女卡牌RPG游戏《十字军骑士》发布上市预告 即将发售!
- 全面解读!20万亿行业迎来首部行政法规 重点来了!
- 恐怖新游《Gore Doctor》已上线Seam 暂不支持中文
- 2023LPL夏季赛7月11日对战队伍海报比拼:JDG vs WE
- 仙剑奇侠传九野谜域穷奇打法介绍 这些卡牌要带上
- 黑龙江省黑河市市场监管局确保旅游市场监管走实走细见成效
- 2023LPL夏季赛7月11日对战队伍海报比拼:AL vs OMG
- 《数据经纪从业人员评价规范》团体标准发布
- 黑龙江省双鸭山市2023年医疗器械安全宣传周启动
- 用电负荷创新高 四川电网全力以赴战高温保供电
- 科普图解 | 世界人口日:科学助力 减少新生儿出生缺陷
- 国网青神县供电公司:八旬老人高温下为电力工人“送清凉”
- 离岛免税让游客更好“购”海南
- 美供乌集束弹药引众怒 日政府“没提出反对意见”
- 黑衣壮群众的“信息使者”
- 萝卜泡菜迅雷下载(谁有韩剧萝卜泡菜的下载地址)
- 2023LPL夏季赛7月11日对战队伍海报比拼:UP vs TES
- 联合国秘书长:需通过监管让人工智能“造福所有人”
- 参与人数创新高 第六届京津冀保龄球交流赛天津站比赛落幕
- 青海管局进行行业安全生产专项检查
- 早安祝福带给你美好的一天
- 张瑞:把水下考古的故事讲给你听
- 陕西城固:千年非遗“花开”指尖 “绽放”海外
- 以创新引领智能建造发展 助推建筑业转型升级——三一筑工创新技术全方位赋能智能建造引关注
- 保险业“降息”众生相:从3.5%到3%,寿险利率下调引发狂欢,新人可月入40万?
- 新洁能7月11日快速回调
- 昔日“蚊子河”变身生态“休闲廊”
- 加强应急通信保障演练 确保汛期“生命线”安全畅通
- 图片新闻
- 周大福:截至6月30日止三个月零售值同比增长29.4%
- 第一季度折叠屏手机销量暴涨117%
- win32kbase.sys蓝屏原因是什么
- 《踏冰逐梦》:冰上舞剧再刷新
- 《长安三万里》背后的故事:一场充满诗意的动画冒险
- 湖北黄梅:以戏为媒,在创新中“破圈”
- 德赛西威(002920)7月10日主力资金净买入1.08亿元
- 一只齿轮的精密蓝海
- 我国即将进入“七下八上”防汛关键期,区域性洪水、干旱、高温热浪并存
- 《婴幼儿配方乳粉产品配方注册管理办法》修订发布
- 王者荣耀芈月宝格丽皮肤价格 璀璨新程多少钱
- 湖南通报8起农村集体“三资”管理突出问题典型案例
- 如何修复api-ms-win-crt-conio-l1-1-0.dll丢失问题
- 公主岭市交通管理大队开展“美丽乡村行”交通安全宣讲活动
- sd卡数据在线恢复有什么方法
- 时隔七年,桃花岛上的“桃花会”又回来了!
- 金融支持房地产市场平稳健康发展有关政策延期至明年底
- 重返未来1999小狗与流浪汉c2大众演员攻略 小狗与流浪汉c2大众演员通关图解
- 热景生物收上交所监管工作函:涉及公司、董事、中介机构及其相关人员
- 天选2蓝屏死机解决方法是什么
- 华特气体07月10日被沪股通减持1.65万股
- 2023全球数字经济大会新品成果在京发布
- 高等教育学科专业结构调整工作深入推进:专业新发展 育人新亮点
- 《英雄之冠》7月12日首测定档
- 预警劝阻别忽视 财产安全要重视
- 官方“带娃”!三亚启动暑期托管服务免费报名工作
- 台州:学会专委会竞选产生
- 魔城公主游戏背景介绍
- 走,去永州丨周凌志:永州,在人性的眼里闪光
- 江苏雷利(300660)7月10日主力资金净卖出8016.19万元
- 《潜水员戴夫》全章节流程攻略 全任务全boss打法全地图指引
- 伽途GT动力性能怎么样及奥迪Q5L尊享运动型怎么样
- 两部门延长两项金融政策 对房企提供持续稳定支持
- 折叠小型电动车自行车(小型折叠电动自行车)
- Keep:港交所IPO股票发行价每股28.92港元
- 智明达(688636)7月10日主力资金净卖出1396.94万元
- 中金:银行股估值有望修复
- 主题教育·办实事解民忧|果园里的“铁娘子”
- 文明观赛,让赛事更精彩(体坛观澜)
- 已推出1000余款特许商品
- 全新解读再现经典 北京人艺新排《哈姆雷特》将演
- 经济日报金观平:强化上市公司董监高责任
- 转变态度?北约秘书长称土耳其总统同意支持瑞典入约
- 节能降碳 ICT赋能信息通信业赋能产业绿色转型 携手共创美好未来
- 暑假来了,陪孩子做些有趣的事吧
- 《长安三万里》上映两日票房超2亿 二维水墨图展现东方之美
- 两市融资余额增加6.64亿元
- 这些工作暂时不会被人工智能取代
- 《COD19》PS平台首周销量曝光:高达440万份!
- 首届乡村儿童艺术嘉年华开幕 为乡村播撒艺术的种子
- 人民日报:坚持以系统观念推动能源革命
- 中华文明起源与早期发展学术研讨会举行
- 今日入伏!中央气象台继续发布高温橙色预警
- 湖北武汉:“艺术车间”研学热 乡野田间展新颜
- 网传“摩托车骑手飙车致2死”,北京市交管局回应