-
中国电信实现千亿参数大模型500公里联合训练试商用
2025/2/26 16:09:38 来源:人民邮电报 【字体:大 中 小】【收藏本页】【打印】【关闭】
核心提示:近日,中国电信宣布,在业内率先完成1024卡千亿参数大模型500公里分布式联合训练试商用,为AI基础设施的协同发展提供了新方案。 此次试商用的核心挑战在于如何实现长距离、近日,中国电信宣布,在业内率先完成1024卡千亿参数大模型500公里分布式联合训练试商用,为AI基础设施的协同发展提供了新方案。
此次试商用的核心挑战在于如何实现长距离、大带宽、低延迟的算力协同。中国电信组织旗下研究院、天翼云、北京分公司深度协作,通过自主研发的“广域智联无损网络”技术,在天津武清至北京瀛海之间构建了一张长达500公里的真实光路环回网络,成功将千亿参数大模型的分布式训练性能提升至单数据中心效能的97%以上。
据北京电信相关负责人王轶介绍,关键技术亮点为采用800G广域无损传输技术,带宽收敛比提升至32∶1,解决了长距传输中因网络拥塞导致的丢包问题。“可以实现50毫秒极速倒换。”王轶表示,通过WSON(光波长保护)技术实现链路中断无感知切换,保障训练的连续性与稳定性。
在此基础上,本次联合训练试商用还利用“息壤”智算平台,集成跨地域算网协同、自动并行、断点续训等功能,实现故障秒级定位与分钟级恢复,大幅提升商用模型的部署效率。
当前,AI大模型训练对算力的需求呈指数级增长,但传统单数据中心模式受限于物理空间、能源成本与地域限制,难以满足需求。中国电信此次突破的核心价值在于,通过跨地域算力整合,将分散的数据中心转化为“虚拟超级计算机”,极大降低了训练成本,同时为“东数西算”等国家工程提供了可落地的技术路径。
此次试商用的成功是中国电信在智算网络领域持续创新和实践的成果,也是积极响应国家战略推动算力网络协同发展的重要举措。未来,中国电信将继续加大在智算网络领域的投入和研发力度,为人工智能产业的发展提供更加强有力的网络支持,助力我国数字经济高质量发展。(记者 刘刚)
转自:人民邮电报
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,邮箱:cidr@chinaidr.com。- 直达16个行业
- 热点资讯
- 24小时
- 周排行
- 月排行
- 产融加速孵化体系:提供就业保障、激活产业服务、盘活楼宇经济、化解地方债务、聚合服贸中盘、拉动消费升级
- 重磅!「周六福·吉」文化主题形象盛大启幕,东方美学盛宴点亮京城
- 第十五届北京国际电影节电影音乐美食嘉年华圆满落幕
- 教育部推动开设1000个微专业和1000个职业能力培训课程 “双千”计划解锁高质量就业密码
- “大飞船”正式启航!深圳科学技术馆开馆首日人气火爆
- 2025 CSF文化会焕新出发:以年轻化战略引领行业变革,跨行业周边定制开辟万亿商机新蓝海
- “银发列车”为何一票难求?
- 景区多元特色主题活动赋能 “五一”假期文旅消费焕新彩
- 八米巨人蜡像亮相杭州 巨人蜡像艺术赋能实体引爆眼球经济
- 合作迈上新台阶 多家跨国车企“加码”投资中国