重生2010:开局做空棉花期货 第596节

  格林伯格在节目播出后转发了嘉宾3号的发言片段,配文:“这就是我想说的!”

  但Reddit上的加密社区很快对他的推文进行了围攻。

  有人直接回复道:“你昨天说Trump币会归零,今天它涨了112%,你有什么资格继续唱空?”

  还有人把格林伯格两个月前的一个帖子翻了出来,那个帖子里格林伯格说比特币在3年内不可能突破1000美元。

  “1200美元了,格林伯格先生,您怎么看?”

  格林伯格没有回复。

  这些保守派势力的代言人在媒体面前卖力渲染加密货币的危害,但全都没用。

  因为绝大多数投资者都在这轮币圈牛市中赚到钱了。

  VR交易所的后台数据显示,2011年前11个月,比特币累计涨幅超过300倍,以太坊自7月上线以来涨幅超过150倍!

  山寨币市场的平均涨幅更是超过了10倍!

  在香江,HKDV的线下零售支付网络覆盖了海港城、时代广场、新世纪广场、百佳超市、屈臣氏,每个月的结算流水以超过30%的速度增长。

  在美国,Coinbase上线首月就获得了80万会员,泰达币总流通量突破了400亿美元。

  这些数字不是预测,是已经兑现的事实!

  投资人的利益已经和加密货币深度绑定,谁想让他们卖掉手里的币,就是在挡他们的财路!

  Reddit加密板块有一个被置顶的帖子,内容很直白:

  “他们想让我们卖掉比特币去买什么?买美股吗?纳斯达克今年涨了不到2%!”

  “加密资产是今年唯一能赚钱的市场,谁让我卖我跟谁急!”

  帖子下方评论区里的数千条回复,清一色地附和。

  除了加密资产之外,其他金融标的近期的表现确实都很差劲。

  美股在进入12月之后连续下跌。

  道琼斯工业平均指数12月1号到4号累计下跌了超过400点,标普500指数同期的跌幅接近2%!

  大宗商品市场更是惨烈。

  WTI原油期货从11月的105美元高点跌到95美元,跌幅接近10%!

  伦敦铜期货在耶伦讲话之后单日暴跌3%,刷新了过去3个月的低点!

  黄金现货在跌破1720美元之后持续阴跌,12月4号收报1705美元,距离10月创下的年内高点的回调幅度也不小。

  全球资金找不到更好的去处。

  彭博社在12月3号的一篇市场分析文章里写道,2011年全球主要资产类别的回报率排名中,比特币(约300倍)排名第一,以太坊(约150倍)排名第二。

  第一和第二远远把第三甩在身后,连尾灯都看不到!

  文章用了一段非常不客气的导语:如果你在2011年没有持有加密资产,你的投资回报率一定远落后于平均市场表现。

  这篇文章被华尔街的保守派批评为鼓吹投机,但彭博社的数据没有错。

  愿意投入加密市场的钱越来越多。

  ……

  香江时间12月4号。

  陈平坐了一架从香江飞往姑苏的客机

  12点整,飞机降落在建邺禄口机场。

  陈平下飞机后,几乎马不停蹄地坐车前往灵境ai实验室。

  灵境ai的研发中心设在姑苏工业园区,是一座独立院落,占地大约30亩。

  院内共有3栋建筑,主楼是数据机房和训练中心的所在地。

  陈平走进主楼时,季铭已经在一楼大厅等着了。

  “小陈,我有件事我需要当面跟你汇报。”

  陈平点头。

  “去会议室说。”

  几分钟后,会议室里的人到齐了。

  季铭坐在陈平左手边,他的对面是原DeepMind的创始人,来自伦敦的大卫·哈萨比斯。

  大卫旁边是灵境ai的算法总监王星原,王星原旁边是工程总监赵知行和数据团队负责人刘帆。

  最后一个人坐在会议桌的角落,穿着一件不起眼的夹克,手里拿着一沓资料,从头到尾没说一句话。

  他是梁文峰。

  季铭清了清嗓子,开口说道:

  “原本计划12月推出女娲1.0版本,但现在看来可能要推迟了。”

  陈平的眉头皱了一下。

  “原因呢?”

  大卫解释道:“训练大语言模型所需要的算力远比我们预估的庞大得多!”

  大卫一边说一边打开电脑,把屏幕转向陈平。

  “我们在今年9月完成了女娲1.0的基础架构设计,当时预估的训练算力需求大约是每秒1000万亿次浮点运算,也就是1PFLOP,基于这个预估,我们采购了英伟达的2000块Tesla M2050计算卡。”

  “但当模型框架搭建完毕、训练数据装载完成、开始正式训练之后,我们发现实际的算力需求远不止这个数字。”

  季铭补充道:

  “女娲1.0的参数量是1700亿个,训练数据集覆盖了超过5000亿个Token,这个规模比我们之前做AlphaGo时大了至少4个数量级。”

  “目前我们手里的计算卡已经不够用了。”

  “1700亿参数???”

  陈平倒吸一口凉气,“刚开始你们不是说女娲1.0版本的参数是1亿吗?”

  “1亿级别的LLM我们在上个月月底就已经训练出来了,但是实测效果非常差,1700亿参数量是我们经过缜密的研究讨论后得出来的结果,它足以让大语言模型产生质变!”

  陈平沉默了几秒,然后问道:

  “那你们还需要多少算力卡?”

  会议室里的人面面相觑。

  季铭看了大卫一眼,大卫又转头看向王星原。

  王星原低头不语。

  最后,梁文峰开口了:

  “如果是买英伟达的计算卡,按照采购价至少需要14亿美元。”

  14亿美元!

  陈平头都大了。

  今年在灵境ai身上已经砸了快60亿美元。

  年初收购灵境科技的原始技术团队和专利,花了8亿美元;

  年中从Google手里抢下DeepMind,斥资2.5亿英镑,折合4亿美元;

  之后搭建姑苏数据中心的硬件基础设施,采购服务器、存储阵列、网络设备,又花了超过20亿美元;

  AlphaGo项目的研发和运营成本累计超过了8亿美元;

  女娲项目前期的框架设计、数据采集、预处理和无成果训练浪费掉的算力,折合成人民币已经超过了50个亿,折合8亿美元。

  如果现在又要砸14亿美元买计算卡,意味着灵境ai在2011年的总投入将突破80亿美元!

  而截至目前,灵境ai唯一拿得出手的商业化产品,是一款几乎没有商业盈利能力的AlphaGo。

  总结一句话就是,60亿美元砸下去,只换来了一堆经验。

  陈平深吸了一口气。

  “14亿美元,能有多少块卡?”

  梁文峰翻了翻手里的资料。

  “英伟达的Tesla M2090单卡售价大约1.2万美元,14亿美元可以买大概11.6万块,但M2090的单卡显存只有6GB,双精度浮点性能每秒665GFLOP,按照女娲1.0的训练需求,11万块卡勉强可以跑起来。”

  “如果等明年英伟达发布开普勒架构的GK110核心,单卡显存提升到12GB,浮点性能提高到1.5TFLOP,同样价格可以买到更少的卡但算力更强,周期大概要到2013年。”

  2013年。

  陈平摇了摇头。

  等不了那么久。

  季铭看到陈平的表情,愈发自责了。

  “陈总,怪我,我当初低估了1700亿参数大模型的训练难度。”

  大卫也低下了头。

  他在DeepMind时做的是强化学习和小规模神经网络,面对1700亿参数的大语言模型,同样处在一路摸索的状态。

  会议室里安静了很长时间。

  陈平叹了口气。

  “虽然女娲1.0没法在短时间内推出,但这14亿美元我会批。”

  季铭和大卫同时抬头。

  陈平继续说道:

  “但我需要一个明确的时间表,不能再像之前那样不断推迟。”

  季铭立刻回答,“如果算力到位,12月底完成第一批训练,1月中旬完成微调,2月底之前可以上线1.0正式版!”

  “可以。”

  陈平说完之后,又看了一眼梁文峰。

  梁文峰的表情自始至终没有任何变化。

  季铭似乎想起了什么,急忙开口。

  “陈总,还有一件事。”

  “说。”

  “虽然女娲1.0没法在短时间内推出,但灵境ai的第一款量化大模型已经进入灰度测试阶段了。”

  陈平的眼睛亮了一下。

  “量化大模型?”

  季铭转头看向梁文峰。

首节 上一节 596/608下一节 尾节 目录