醉书楼 > 都市小说 > 股海弄潮TXT下载 > 股海弄潮最新章节列表 > 第384章 17岁,跨洋代码(第1节)

股海弄潮最新章节全文阅读

作者:天门山的魅狐  加入书架  股海弄潮天门山的魅狐  股海弄潮全文阅读
股海弄潮最新章节第一卷知识点(26-03-12)    第384章 17岁,跨洋代码(26-04-26)    第383章 我们投出了一个“朋友圈”(26-04-26)    

第384章 17岁,跨洋代码(第1节)

2024年7月25日,星期四,晚上八点。

深圳,默石资本,技术部。

暑假已经过半,技术部的灯比平时亮得更晚。陆方坐在工位上,面前是三块屏幕,每块都显示着密密麻麻的代码和模型输出。他正在测试星海大模型模块的准确率——89%,比上个月提高了1个百分点,但离90%的目标还有差距。他有些沮丧。不是因为他不够努力,是因为他觉得自己可能走错了方向。大模型的发展太快了,每个月都有新论文,每个月都有新模型。他追不上。

手机震动了。是陈曦发来的消息:“陆方叔叔,我这边是早上。你那边应该是晚上吧?吃饭了吗?”

陆方回复:“还没。在调模型。”

陈曦:“什么模型?”

陆方:“星海的大模型模块。准确率卡在89%,上不去了。”

陈曦:“你有没有试过开源模型?比如LLaMA、Falcon、Bloom?我用它们在伯克利的服务器上做过测试,准确率能到92%。”

陆方愣了一下。他当然知道这些开源模型,但他没有试过。因为他的思维还停留在“自己训练模型”的阶段,没有想过用现成的开源模型做微调。这就是代际差异——他这一代人,习惯从零开始造轮子;她那一代人,习惯站在巨人的肩膀上。

陆方:“我没试过。你能帮我跑个测试吗?”

陈曦:“可以。你发我一份测试数据集。”

陆方从星海平台导出100份招股书摘要和对应的分析报告,打包发给陈曦。数据集不大,几百兆。

陈曦:“收到了。我明天给你结果。”

陆方:“好。谢谢。”

陈曦:“不客气。”

2024年7月26日,星期五,上午十点。陆方收到了陈曦的测试结果。她用了三个开源模型——LLaMA-7B、Falcon-7B、Bloom-7B——在伯克利的服务器上做了微调。结果让陆方震惊——LLaMA-7B的准确率最高,达到91.5%,比星海大模型模块的89%高出2.5个百分点。Falcon-7B达到90.2%,Bloom-7B达到89.8%。三个模型的平均准确率90.5%,超过了星海。

陆方看着那个数字,沉默了很久。他想起自己花了三个月时间调参数、优化模型,准确率只提高了1个百分点。陈曦只花了一个晚上,用开源模型微调,就把准确率提高了2.5个百分点。不是他

本章未完,请点击"下一页"继续阅读! 第1页 / 共6页