”
他注册了一个云服务账号,租了一台带A100显卡的服务器。按小时计费,一小时十几块钱。他把模型上传,开始微调。等了两个小时,结果出来——准确率93.1%。他靠在椅背上,长出一口气。
他给陈曦发消息:“13B跑通了。93.1%。”
陈曦:“厉害!下一步,可以试试多模型集成。把几个模型的预测结果加权平均,准确率还能再提高。”
陆方:“多模型集成?我没试过。”
陈曦:“试试。不复杂。就是把几个模型的输出做加权平均。权重可以用验证集上的准确率来定。”
陆方:“我明天试试。”
陈曦:“好。有结果告诉我。”
2024年7月30日,星期二,上午九点。陆方完成了多模型集成的测试。他用LLaMA-7B、Falcon-7B、Bloom-7B三个模型,在验证集上计算准确率,然后用准确率作为权重,对三个模型的输出做加权平均。测试结果——准确率94.2%,超过了单一模型。他给陈曦发消息:“多模型集成跑通了。94.2%。”
陈曦:“厉害!夏普比率多少?”
陆方:“1.9。”
陈曦:“不错。继续优化,争取到2.0。”
陆方笑了。他想起2019年,陈曦第一次来公司,画了那张产业链图谱。那时候,她才11岁,什么都不懂。现在,她在伯克利,教他做多模型集成。
他关掉电脑,站起来,走到窗前。窗外,深圳的夏阳炽烈,平安金融中心的玻璃幕墙反射着刺眼的白光。远处,深圳湾的海面平静如镜。他想起周寻说过的话——“淘汰我们的不是技术,是我们不会用技术。”他学会了用技术。不是被技术淘汰,是用技术淘汰别人。这是他的路。
他转过身,走回工位,打开电脑,继续调模型。
2024年8月1日,星期四,上午九点。技术部晨会。陆方站在白板前,手里拿着马克笔。他的眼袋很深,但眼神很亮。
“过去一周,我用开源模型做了微调和多模型集成。准确率从89%提高到94.2%。”他在白板上写了几个数字:89%→94.2%。
“下一步,我计划把开源模型正式接入星海平台,替换掉现有的大模型模块。成本更低,效果更好,而且我们自己可以控制模型,不用依赖外部API。”
周寻举手。“那现有的大模型模块怎么办?”
本章未完,请点击"下一页"继续阅读! 第3页 / 共6页
