醉书楼 > 都市小说 > 股海弄潮TXT下载 > 股海弄潮最新章节列表 > 第236章:第一个“因子”的寻找(第3节)

股海弄潮最新章节全文阅读

作者:天门山的魅狐  加入书架  股海弄潮天门山的魅狐  股海弄潮全文阅读
股海弄潮最新章节第一卷知识点(26-03-12)    第240章:第一个小胜利:结合因子的增强(26-03-28)    第239章:因子库的扩张(26-03-28)    

第236章:第一个“因子”的寻找(第3节)

一天,不大。但如果用来算年化收益,差之毫厘,谬以千里。”

他顿了顿:

“而且,如果三分钱的误差是系统性的,那整个回测结果都会偏。”

陈默沉默了几秒。

然后他问:

“那怎么办?”

周寻想了想:

“找第四个来源。如果还是对不上,就取中位数。然后把这个问题记下来,以后做敏感性分析。”

他看着陈默:

“所有类似的问题,都要记下来。不能假装不存在。”

陈默点头。

他拿起一支笔,在笔记本上写下第一行:

“数据问题清单”

下面,他写:

1. 2005.6.30 招商银行 收盘价 三个来源不一致 (6.52/6.55) 处理:取中位数6.53

2. ……

这本笔记本,后来成了“默石数据清洗史”的第一页。

整整三年后,他们才真正拥有一套干净的、可用的十年数据库。

而这本笔记本,已经写满了三百多页。

---

下午三点,陈默亲自开始核对数据。

陆方给他分配了第一批任务:2005年到2007年,上证50成分股的日线数据。

一共50只股票,三年,大约750个交易日。每只股票每天有开盘、收盘、最高、最低、成交量、成交额——六个字段。

总共225,000个数据点。

陈默坐在那张折叠桌前,面前摊着三份打印出来的表格——分别来自三个不同的数据源。

他的任务:一行一行比对,把不一致的地方标出来。

第一行,招商银行,2005年1月4日。

来源A:开盘8.52,收盘8.55,最高8.60,最低8.48

来源B:开盘8.52,收盘8.55,最高8.60,最低8.48

来源C:开盘8.51,收盘8.55,最高8.60,最低8.48

开盘价差一分钱。

陈默拿起红笔,在来源C那一列画了个圈。

然后他翻开笔记本,写下:

2005.1.4 招商银行 开盘 来源C=8.51 其他=8.52 差异0.01 暂以多数为准

第二行,2005年1月5日。

本章未完,请点击"下一页"继续阅读! 第3页 / 共6页