醉书楼 > 其他小说 > 这个男人太懂炒作TXT下载 > 这个男人太懂炒作最新章节列表 > 第六百七十八章 天佑我中华(第3节)

这个男人太懂炒作最新章节全文阅读

作者:我爱吃咸肉  加入书架  这个男人太懂炒作我爱吃咸肉  这个男人太懂炒作全文阅读
这个男人太懂炒作最新章节新书已发布,点开作者主页可以直接找到(25-08-13)    新书《与神女同居,分她一半香火》已发布(25-08-11)    完本感言(25-03-31)    

第六百七十八章 天佑我中华(第3节)

轴了。

该说不说,托《流浪蓝星》里的MOSS的福。

当前来参观的老先生以及随同人员们,看到这个也叫MOSS的AI的时候,兴致瞬间就来了。

但随着高文的介绍和测试,众人的表情,纷纷变得严肃了起来。

尤其是刚刚对着徐希羽好一番交代的老先生,摆手打断道:“小高,你等一下。

你是说,你们团队用了国外团队十分之一的成本,训练出了水平差不多的AI模型?”

“对。”高文点了点头,在看徐希羽一眼后,他用着尽量通俗的措辞继续道:“不过十分之一只是一个相对粗略的计算。

目前,我们正在和徐总共同训练MOSS-550B和Wei-550B。用于训练的芯片是英伟达H100的阉割版H800。

由于我们的架构比较优秀,所以,我们实现了处理每万亿个Token,也就是AI能够处理的最小数据单元,只需要18万个小时的GPU运算时间。

我们现在有2048块GPU同时运算,所以,处理这些数据,只需要3.7天。而我们整个预训练阶段需要处理的数据,预计需要花费266.4万小时。

加上,上下文长度扩展的19万小时,以及后训练的5千小时,我们550B完整训练,只需要花费278.8万GPU小时,也就是两个月左右。

因此,现在每块英伟达H800GPU的租赁价格大概是每小时2美元,这代表着,我们550B的总训练成本,只需要557.6万美元。

不过这个成本仅包括我们的官方训练时的成本。不包括与架构、算法或数据的先前研究和消融实验相关的成本。

而作为对比,和我们同水平的ChatGPT-4的训练成本,需要超过1亿美元,因此,如果仅仅是算这个,他们的成本,是我们的十八倍。”

该说不说,即便是高文已经尽量通俗了,可听讲的人当中,有9成还是没怎么听懂。

不过没听懂没关系,作为领导,最大的能力就是抓住核心。

而高文刚刚的核心其实就四个:更低的算力(阉割版的芯片)、更好的架构、更低的价格、同等的水平。

当这四个关键组合起来,老先生的眼睛直接亮了。

熟。

这味道太熟了。

这些年,在其他行业,老先生曾无数次见证过类似的说法,更低的成本,同等的水平;同等的成本,更高的

本章未完,请点击"下一页"继续阅读! 第3页 / 共6页