醉书楼 > 都市小说 > 高二分科,我选校花也选亿万身家TXT下载 > 高二分科,我选校花也选亿万身家最新章节列表 > 第622章 深度学习变天了(第4节)

高二分科,我选校花也选亿万身家最新章节全文阅读

作者:黑狗不爱吃汤圆  加入书架  高二分科,我选校花也选亿万身家黑狗不爱吃汤圆  高二分科,我选校花也选亿万身家全文阅读
高二分科,我选校花也选亿万身家最新章节第792章 百亿补贴,除夕夜总攻(26-06-09)    第789章 留着美金,买下全世界(26-06-09)    第788章 闭门会,我们的无限开火权(26-06-09)    

第622章 深度学习变天了(第4节)

但现在他回过头来看,那个十八岁的少年说的每一句话,都精准地指向了这个领域未来五到十年的核心命题。

残差连接解决了深层网络的训练问题。

但那个少年想要的,显然不止于此。

任少卿盯着那面光墙,脑子里像打开了一扇被堵住很久的门。

五十层的残差网络证明了一件事:网络可以做得很深,深度不再是瓶颈。

那下一个瓶颈是什么?

他几乎是本能地想到了那个词。

宽度。

或者更准确地说,视野。

卷积网络的每一层只能看到一个局部窗口。

三乘三,五乘五,最大也就七乘七。哪怕你把网络堆到一百层,每一层看到的依然是一小块局部区域。

它通过层层叠加来扩大感受野,但这种扩大是间接的,是逐层递推的,不是一步到位的。

如果数据不是图片呢?

如果是一段文字,一个句子,一篇文章?

文字里的语义关联可以跨越整个句子。

第一个字和最后一个字之间可能存在关键的依赖关系。卷积核看不到那么远。

循环神经网络可以看到,但它是串行的,一个字一个字往后递,速度慢得要命,而且同样存在梯度消失。

只不过是时间维度上的梯度消失。

那如果……

任少卿摇了摇头,把这个念头暂时压下去。

他现在面前摆着一堆更紧迫的问题。

论文要不要写?投哪个会议?实验还需要补哪些对照组?

一百层的网络还没跑,一百五十层呢?

目标检测任务上的迁移效果怎么样?

另外,残差连接这个结构目前只在图像分类上验证过。

要推广到其他任务、其他数据类型,工作量巨大。

他手上就两个师弟,根本忙不过来。

这些问题每一个都很具体,每一个都需要人手、时间和资源。

“少卿哥。”

郑宇航不知道什么时候走到他旁边来了,手里端着两杯速溶咖啡,递了一杯过来,

“你是不是该跟上面汇报一下了?”

任少卿接过咖啡,没喝。

“上面”。在这个基地里,“上面”这个词只指向一个人。

他入职快半年了,跟那个黄毛少年只见过一次面。

日常

本章未完,请点击"下一页"继续阅读! 第4页 / 共5页