本文作者:访客

100%稳定!摩尔线程GPU千卡集群适配滴普科技大模型训练、推理

访客 2024-05-29 11:00:15 39634 抢沙发
100%稳定!摩尔线程GPU千卡集群适配滴普科技大模型训练、推理摘要: 5月29日消息,摩尔线程与国内领先的数据智能服务商滴普科技共同宣布,摩尔线程夸娥(KUAE)千卡智算集群与滴普企业大模型Deepexi v1.0已完成训练、推理...

5月29日消息,摩尔线程与国内领先的数据智能服务商滴普科技共同宣布,摩尔线程夸娥(KUAE)千卡智算集群与滴普企业大模型Deepexi v1.0已完成训练、推理适配,获得产品兼容互认证明。

100%稳定!摩尔线程GPU千卡集群适配滴普科技大模型训练、推理

基于摩尔线程夸娥千卡智算集群,滴普科技成功完成了LLaMA2 700亿参数大语言模型的预训练测试。

训练时长共计77小时,全程无故障连续运行,集群训练稳定性达到100%,训练效率和兼容性均达到预期。

有趣的是,兼容互认证明的发证时间是2023年9月28日,也就是相关适配工作早就完成了,如今才公开。

北京滴普科技有限公司成立于2018年,定位于数据智能服务商,为客户提供数据智能基础设施、企业大模型产品,以及数据智能创新服务。

目前,滴普科技已与中国海诚、中核装备院、百丽时尚等企业开展产业落地实践,成为产业大模型落地的领先企业。

滴普科技的Deepexi企业大模型,在语义、视觉、语音、跨模态等方面表现优越,可运用模型工具链,为企业提供高质量的数据准备、模型训练、调优、部署及推理服务,快速构建不同领域的模型、智能体应用。

摩尔线程夸娥方案是业内首个跑通、跑完国产大模型的千卡集群,基于全功能MTT S4000 GPU,提供软硬一体化的全栈解决方案,具备模型覆盖、推理加速、CUDA兼容、断点续训、分布式训练、集群可靠性等8大核心能力。

在此之前,摩尔线程已经第一家接入无问芯穹,夸娥千卡集群先后适配无穹Infini-AI大模型开发与服务平台、完成LLama2 700亿参数大模型训练测试、完成MT-infini-3B 3B(30亿参数)规模大模型实训。

憨猴集团也基于摩尔线程的夸娥千卡智算集群,成功完成了7B、34B、70B不同参数量级的大模型分布式训练,效率、精度、稳定性都相当完美。

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,39634人围观)参与讨论

还没有评论,来说两句吧...