第229章【一夜爆红的神秘高手（二合一）】是科技之全球垄断最新章节(第1节)

芙，终于展现了“她”非同凡响的一面，其强大的学习能力让“她”适应了这个水平的“tvz”对抗，并且轻松的以操作碾压战胜了对手。

这一场对抗娜芙虽然以堪比顶级职业选手的操作水平把对手打败，但其中一个细节就是“她”从来不会在相同的地方犯第二次错误。

换个说法就是，娜芙的学习进步速度太恐怖了，每一次对抗对“她”来说都是学习。

罗晟通过这五场与人类玩家对抗的比赛中也看到了娜芙暴露出来的一个缺陷，就是除了特定的分兵战术，“她”并不能形成灵活的兵力分配。

在输掉的第四局对抗中，一名高水平的人类玩家对娜芙的基地不停的多线骚扰，而“她”一旦回防对方就立刻跑路，等“她”的兵出门展开进攻的时候又转回来继续骚扰。

这场对抗，面对人类玩家的灵活出兵策略，娜芙只能被动应战，无法形成对人类玩家的有效进攻，也导致了最后滚雪球效应起来了。好书记得一定要分享哟,快去分享醉书楼小说网www.zslxsw.//com吧

最终落败。

第五局对抗结束之后，罗晟让娜芙停止了匹配对手，然后对其重新进行了一次大幅的升级优化。

他觉得这样的学习效率仍然显得太慢。

娜芙的智能体采用的是深度学习算法，罗晟对其进行了一次精心升级之后，包括了神经网络、通过强化学习的自我对弈，多智能体学习、模仿学习等算法或技术。

其中所谓的自我对弈，简单说就是自我学习，通过不断的试错找到让自己胜率最大的游戏方式。

而通过自我对弈和强化学习，构成了开放端学习算法的基本范式，学习人的策略，并确保娜芙的智能体在整个游戏过程中不断探索这些策略，从而让“她”获得更大的升级与进步。

此外，由于星际争霸这款游戏具有巨大的动作空间，会让许多先前强化学习方法变得无效。

罗晟因此还为娜芙开发了一种全新的算法进行非策略强化学习，使得“她”能从旧有的历史决策的游戏中有效的更新决策。

而罗晟的终极目的可不是让娜芙成为一个“iba”的星际争霸ai玩家，而是以此为起点，让“她”能够胜任复杂多变的其它应用场景。

如果“她”只是在星际争霸的比赛中成为超级高手，换个场景，例如在围棋、语言或其它领域就不行了，那依然是个纯粹的人工智障，和真正的人工智能有着巨大的差距。

……

时间一分一秒的流逝，罗晟猫在他的办公室不知不觉就耗费了三个多小时，为娜芙完成了第二次的优化升级才下班，时间已

本章未完，请点击"下一页"继续阅读！第2页 / 共6页

科技之全球垄断最新章节全文阅读