尝谕提示您:看后求收藏(第1114章 【张烨的贡献!】,我真是大明星,尝谕,114中文),接着再看更方便。
请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,避免出现内容无法显示或者段落错乱。
众人都看过来。
吴长河说道:“有人给了我一份关于那个p什么的东西的工作原理。”他把东西给了弟子田伟伟,“放屏幕上给大家看。”
田伟伟立即道:“好的!”
众人半信半疑。
“工作原理?”
“有人分析出来了?”
“是真的吗?”
“这也太快了吧?”
单东河也眼睛一亮,赶紧大步上去,“吴哥,是谁发来的?”
吴长河撇了撇嘴,“你别管是谁了,反正是个搞数学工作的。”
屏幕很快打出来了!
众人全部看去!
向荣也抬起头!
peter。
这是一款围棋人工智能程序。
主要包括4个部分:
1走棋网络(policy-work),给定当前局面,预测采样下一步的走棋。
2快速走子(fast-rollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度要比1快1000倍。
3估值网络(vae-work),给定当前局面,估计是白胜还是黑胜。
4蒙特卡罗树搜索(onte-carlo-tree-search,cts,把以上这三个部分连起来,形成一个完整的系统。
它的主要工作原理是深度学习。深度学习是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络‘大脑’进行精准复杂的处理,就像人们识别物体标注图片一样。它有两个“大脑”,是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。
第一大脑:落子选择器(ove-picker)。
第二大脑:棋局评估器(position-evaator)。
等等等等!
两千字的研究分析,好像一个科研项目书,太专业了!
众多职业棋
本章未完,点击下一页继续阅读。