。这次没有报错,但输出是一大堆乱码。周寻说:“编码问题,加一行设置编码。”陈曦加上,再运行,终于看到了干净的网页源代码。
她高兴地拍手。“出来了!”
周寻笑了。“这才第一步。你还要从源代码里找到公告数量那个数字。”他指着一行HTML代码,“你看,这里写着‘共找到xx条公告’。你要把这个数字提取出来。”
陈曦皱起眉头,盯着那行代码看了很久。然后她问:“是不是用正则表达式?”
周寻愣了一下。“你知道正则表达式?”
“我在书上看过。但没学会。”陈曦有些不好意思。
周寻笑了。“你爸在你这个年纪,连电脑都没摸过。你比他强。”
陈曦用了整整三天,才把那个爬虫跑通。第一天,她学会了请求网页和解析HTML,但提取数字时总是不对——因为网页结构有变化,她没考虑到。第二天,她学会了用正则表达式匹配数字,但运行时又报错,原因是某个公告页面没有“共找到”这个字段。第三天,她加了异常处理,代码终于稳定运行。当她看到屏幕上成功打印出“42”时,高兴地从椅子上跳了起来。
“周叔叔!我成功了!”
周寻走过来,看了看代码,又看了看运行结果。代码写得很稚嫩——变量名用的是a、b、c,没有函数封装,异常处理只是简单的pass。但它能跑,而且抓对了。
“不错。”周寻拍了拍她的肩膀,“比你爸当年强,他这会儿还在看K线图呢。”
陈曦仰起头,眼睛亮晶晶的。“周叔叔,我以后也能像你一样写代码帮爸爸吗?”
周寻看着她,沉默了一秒。然后他认真地说:“等你考上大学,学明白了,再来。”
“那我要学多久?”
“至少十年。”
陈曦伸出两只手,数了数手指头。“十年后,我就二十一岁了。”
“对。到时候,你可能比我还厉害。”
陈曦笑了,露出两颗小虎牙。她把代码保存好,合上电脑,跑出技术部去找陈默。陈默正在办公室和沈清如讨论一家生物医药公司的估值,门被猛地推开。
“爸爸!我会写爬虫了!”
陈默抬起头,看着女儿兴奋的脸,笑了。“是吗?抓到什么了?”
“抓到了科创板公告的数量!今天有42条!”
沈清如在一旁看着,眼眶微微有些湿润。她想起陈曦小时候,
本章未完,请点击"下一页"继续阅读! 第2页 / 共3页
