醉书楼 > 都市小说 > 股海弄潮TXT下载 > 股海弄潮最新章节列表 > 第379章 实验室里的深夜对话(第5节)

股海弄潮最新章节全文阅读

作者:天门山的魅狐  加入书架  股海弄潮天门山的魅狐  股海弄潮全文阅读
股海弄潮最新章节第一卷知识点(26-03-12)    第384章 17岁,跨洋代码(26-04-26)    第383章 我们投出了一个“朋友圈”(26-04-26)    

第379章 实验室里的深夜对话(第5节)

周寻举手。“那现有的大模型模块呢?”

陆方想了想。“保留。作为备用。”

陈默站在门口,听着陆方的汇报,笑了。他转身走回办公室,对沈清如说:“陆方把准确率提高到92.3%了。”

沈清如抬起头。“这么快?”

“他说用了多模型集成。三个开源模型加权平均。”

沈清如笑了。“他这是要把星海大模型模块淘汰掉。”

陈默点头。“对。自己淘汰自己。”

沈清如看着他。“这不就是你教他们的吗?‘技术是工具,不是主人。’”

陈默笑了。“对。”

晚上,陆方坐在工位上,面前是三块屏幕。左边是星海平台的监控界面,中间是多模型集成的测试结果,右边是陈曦发来的消息。他正在和陈曦讨论下一步的计划。

陆方:“多模型集成跑通了,准确率92.3%。下一步,我想试试用强化学习来优化权重。”

陈曦:“可以。但强化学习需要奖励函数。你怎么定义奖励?”

陆方:“准确率。奖励就是准确率。”

陈曦:“那太简单了。试试用夏普比率?不仅要准,还要稳。”

陆方:“夏普比率?我用的是分类任务,不是交易策略。”

陈曦:“分类任务也可以用夏普比率。把准确率看成收益,把方差看成风险。最大化夏普比率,就是最大化收益风险比。”

陆方沉默了几秒。“有道理。我试试。”

陈曦:“好。有结果告诉我。”

陆方放下手机,打开论文,开始研究强化学习。

2024年3月31日,星期日,晚上十一点。

陆方完成了强化学习的第一个版本。他用夏普比率作为奖励函数,训练了一个权重优化模型。测试结果:准确率93.1%,波动率下降了30%。他在笔记本上写道:“强化学习有效。下一步,部署到星海平台。”

他给陈曦发消息:“强化学通了。准确率93.1%,波动率下降30%。”

陈曦回复:“厉害!夏普比率多少?”

陆方:“1.8。”

陈曦:“不错。继续优化,争取到2.0。”

陆方笑了。他想起2019年,陈曦第一次来公司,画了那张产业链图谱。那时候,她才11岁,什么都不懂。现在,她在伯克利,教他做强化学习。时间过得真快。

本章未完,请点击"下一页"继续阅读! 第5页 / 共6页