互联网巨头AI大模型12-腾讯算力

互联网巨头AI大模型12-腾讯算力

腾讯发布大模型算力集群 HCC 大幅提速模型训练。大模型进入万亿参数时代,单体服务器提供的算力有限,需要将大量服务器相连,协同优化单机算力、网络架构和存储性能,打造大规模、分布式的高性能计算集群。以新一代集群为标志,基于自研芯片、星星海自研服务器和分布式云操作系统遨驰,腾讯云正通过软硬一体的方式,打造面向 AIGC 的高性能智算网络,持续加速全社会云上创新。

2023 年 4 月 14 日,腾讯云发布新一代 HCC 高性能计算集群,其采用最新一代星星海自研服务器,搭载NVIDIA H800 Tensor Core GPU,并基于自研网络、存储架构,带来 3.2T 超高互联带宽 TB 级吞吐能力和千万级 IOPS。实测结果显示新一代集群算力性能较前代提升 3 倍。2022 年 10 月,腾讯完成首个万亿参数的 AI 大模型——混元 NLP 大模型训练。在同等数据集下,将训练时间由 50 天缩短到 11 天。如果基于新一代集群,训练时间将进一步缩短至 4 天。

服务器单机性能是集群算力的基础,新一代集群的单 GPU 卡在不同精度下,支持输出最高 1979 TFlops 的算力。针对大模型场景,星星海自研服务器采用 6U 超高密度设计,相较行业可支持的上架密度提高 30%;利用并行计算理念,通过 CPU 和 GPU 节点的一体化设计,将单点算力性能提升至更高。

计算节点间,存在着海量的数据交互需求。随着集群规模扩大,通信性能会直接影响训练效率,需要实现网络和计算节点的最大协同。腾讯自研的星脉高性能计算网络,具备业界最高的 3.2T RDMA 通信带宽。实测结果显示,搭载同等数量的 GPU,3.2T 星脉网络相较 1.6T 网络,集群整体算力提升 20%。同时,腾讯自研的高性能集合通信库 TCCL,融入定制设计的解决方案。相对业界开源集合通信库,为大模型训练优化 40%负载性能,消除多个网络原因导致的训练中断问题。

大模型训练中,大量计算节点会同时读取一批数据集,需要尽可能缩短数据加载时长,避免计算节点产生等待。腾讯云自研的存储架构,具备 TB 级吞吐能力和千万级 IOPS,支持不同场景下对存储的需求。COS+GooseFS对象存储方案和 CFS Turbo 高性能文件存储方案,充分满足大模型场景下高性能、大吞吐和海量存储要求。

此外,新一代集群集成了腾讯云自研的 TACO 训练加速引擎,对网络协议、通信策略、AI 框架、模型编译进行大量系统级优化,大幅节约训练调优和算力成本。腾讯太极机器学习平台自研的训练框架 AngelPTM,也已通过腾讯云 TACO 提供服务,帮助企业加速大模型落地。依托分布式云原生的治理能力,腾讯云智算平台提供 16 EFLOPS 的浮点算力,规模业界领先。通过腾讯云的大模型能力和工具箱,企业可结合产业场景数据进行精调训练,提升生产效率、快速创建和部署 AI 应用。

互联网巨头AI大模型12-腾讯算力

免费服务:

(在舍得低碳公众号发送以下关键字可以查看相关系列的内容)

宏观分析,国际碳市场,中国碳市场,碳市场展望,中国碳价调查,碳交易,碳资产,碳关税,大宗商品关税,碳关税专家交流,欧盟碳关税计算,碳减排制度,发达国家碳排放政策,ISO14064-1,温室气体盘查,产品碳足迹,碳计量,碳排放,低碳供应链,可持续发展案例,可持续发展调研,循环经济,乡村振兴,碳中和城市,碳中和招聘岗位

ESG,ESG数据,ESG市场回顾,ESG实践案例,粤港澳⼤湾区ESG,钢铁ESG,计算机软件ESG,成品药行业ESG,美妆行业ESG,光伏电池组件ESG,ESG污染排放指标

CCER,CCER制度,CCER项目减排效益测算,CCER电力方法学,VCS方法学,林业碳汇,林业碳汇项目开发,碳汇造林方法学,林业碳汇专家交流,甲烷减排,绿色金融,个人碳账户

碳中和,电力碳中和,水泥碳中和,玻璃碳中和,化工碳中和,钢铁碳中和,电子制造业碳中和,CCUS,CCUS产业政策,CCUS技术及应用,CCUS技术进展,氢能,绿氢,氢能发展与电解水制氢,抽水蓄能,太阳能热发电,世界能源发展报告

智慧园区碳中和,零碳智慧园区案例,华为零碳智慧园区,华为智慧园区建设和运营,工业互联网双碳园区,智慧建筑碳中和,商业建筑碳中和,房地产碳评估,智慧交通碳中和,数据中心碳中和,远景零碳,零碳制造,零碳案例,低碳转型案例

汽车碳中和,汽车行业碳中和,中国乘用车双积分,2022 世界新能源汽车大会,广东汽车碳足迹,汽车左B柱LCA,汽车白车身LCA,废旧轮胎再生橡胶LCA,新能源汽车人才供需,中国汽车技术趋势,智能汽车产业链

绿电,绿电专家交流,电价政策,电力市场政策,澳洲电力危机解析,新型储能政策专家交流,户用储能,户用储能成本与收益计算,欧洲户用储能专家交流,国内储能项目进展,储能,长时储能,储能市场分析,虚拟电厂,电力交易,电力市场改革趋势

锂电池,固态电池,电池回收,动力电池,动力电池发展趋势,动力电池市场回顾,传统车企电动化战略,动力电池全球市场格局,锂电材料专家交流,磷酸铁锂专家交流,磷酸铁,石墨化专家交流,4680大圆柱电池,电池隔膜行业竞争壁垒,磷酸锰铁锂,Pet铜箔,钠离子电池,动力电池新技术,

行业趋势,光伏,半导体,机器人

互联网巨头AI大模型12-腾讯算力

付费服务(零碳工厂、零碳园区):

1、个人和企业层面的碳排放管理、碳资产管理培训

互联网巨头AI大模型12-腾讯算力

2、上市企业、各类园区:ESG、组织层面碳盘查、产品层面碳足迹、碳中和规划、碳配额资产托管、国内外碳信用申请和交易(CCER、林业碳汇、VCS、GS等)

互联网巨头AI大模型12-腾讯算力

© 版权声明

相关文章