第二百零六章 玄清杯
可以说几十年来一个一直争论不休的问题就是古棋和现代围棋谁厉害的问题。
特别是阿尔法狗完败人类棋手后,这个问题更是争论不休。以前是争论黄龙士范西平相当于现在几段,现在是争论黄龙士吴清源能否战胜阿尔法狗。
阿尔法狗是个围棋软件,几乎输入了所有的古今中外的围棋高手对局,也是如此,想战胜的情结也能理解。
关公战秦雄是相声里面的段子,其实就是健在的棋手,也是没办法比较的。
一个时代有一个时代的骄傲。聂卫平现在肯定赢不了当下的九段,但要是中日擂台赛的巅峰状态呢?
曾经石佛李昌镐现在还不是想赢一盘都难,似乎结婚后水平就江郎才尽了。当然还有同时期的常昊,索性做官了。
围棋学起来恨简单,基本规则一天就可以明白。想到这个唐玄生问糖糖:“你有把握吗?”
糖糖道:“这个月我把死活定式手筋官子都看一遍,应该就可以了。还有那个阿尔法狗的全部对局,知己知彼百战百胜。我要评估一下他的水平和弱点。”
关子清听出了一些关键:“那就是说,你还不会下棋?我的天啊!”
糖糖道:“这个和赢棋有关系吗?其实我多数时间是在推导所有的组合概率。这个才是关键。现在把所有排列组合演化出来,去掉大量明显不合理的。然后阿尔法狗也是注定要输的。”
唐玄生明白糖糖的意思,就是了解围棋死活定式手筋这些基本概念后,她要把所有的可能性用棋路树的方法全部推导出来。
所谓棋路树,就是把所有的下法想象成一棵大树,从第一步开始,你有三百六十一个选点,这就相当于棋路树上面从底部生长出三百六十一个分叉。然后对方的选点就变成了三百六十个,这等于又多出三百六十个分叉。
这样类推下去,所有的下法就像是一棵参天大树。
当然,现在人类的计算机还没有这么大的算法可以支撑。但对糖糖或者孙小圣而言,这显然不是什么问题。
就好比原来一本书很占面积,但用电脑保存的话,一个小小的u盘就相当于一个图书馆的书籍总量。
对糖糖而言,就是更进一步。
而且全部推导出来之后,这样的下棋其实已经是个bug了。想想你认真思考的下法在糖糖眼里仅仅是必然的可能性的一种。也就是说除非你每一步都是最正确的,但这显然不可能。
当所有的可能性都推导出来后,糖糖就会进行算法优化,也就是把下法进行评分,每一步后双方的输赢概率。
其实这是围棋选手的一个基本功,就是判断局势。但人类的判断是一种模糊判断,这个判断的高低客观上决定了水平的高低和最后的输赢。
围棋比赛经常会有高手解说,譬如这么走会是黑好,或者盘面白优势这些说法。但这个都是很模糊的,除非是盘面相差很大。但那种就是业余棋手都能看出来了。
唐玄生想了想道:“这个想法好,等你推导出来了记得把最优化的走法走个一局然后给我瞧瞧。等以后也公布出去,让他们知道什么叫完美的一局棋。”
兰姐好奇道:“你的大脑会特异功能吗?这么厉害,那可是1的后面好多0呢!”
关子清道:“那这样的话,第一局放在金陵吧。也给公司做个宣传。一个亿的彩头,想不火都难。要不,干脆趁机举办个世界围棋大赛,邀请等级分前五十的高手和世界各地选派的高手参加。”
唐玄生道:“那就我们名字都出一个字,叫玄清杯吧。奖金直接比现在的大赛都高一倍,然后参加预赛的就有对局费,越往后对局费就直接翻倍。”
糖糖道:“主人那我就把冠军赢回来。”
唐玄生想了想道:“你参加第一届的,后面就让别人去比赛吧。不过你想的话国际上有许多比赛,你可以弄个大满贯然后隐退。不然对那些棋手不公平。”
想想将来你怎么走都在人家的意料之中,就像打牌,无论你出什么都是大你的,这还这么玩。
理论上说,围棋其实就是你的每一步选点都要是效率最大的。但实际上不太现实,因为还有急所的限制。也就是你譬如走个星,但现在涉及死活了,就不能放弃去占那些效率最大的点。
就是如何在全局和局部之间找到那个最大的平衡点。
唐玄生也有些好奇真正最后糖糖拿给自己的棋谱会不会是像古代传说中那些仙人的棋谱。
古代有些棋谱明显的看的出来和当时的下法天差地别,这说明还是有厉害的脑洞大开的世外高人的。
很快辣椒萝卜和圆晶厂的官网上面就登出了圆晶厂拿出一亿彩头挑战阿尔法狗的新闻。这甚至还导致股价波动了一下,当然还有后续的辣椒萝卜圆晶厂,也就是唐家举办的玄清杯世界围棋大赛。
超高的奖金往往才能出现精彩对局,也就是重赏之下必有勇夫。
其实早在2017年5月,在柯洁与阿尔法围棋的人机大战之后,阿尔法围棋团队宣布阿尔法围棋将不再参加围棋比赛。2017年10月18日,deepmind团队公布了最强版阿尔法围棋,代号alphago zero。
也就是说人家算是功成身退了,糖糖真正要挑战的应该是最强版的阿尔法狗。
阿尔法围棋(alphago)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,由谷歌(google)旗下deepmind公司戴密斯?哈萨比斯领衔的团队开发。其主要工作原理是“深度学习”。
2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜。
2016年末2017年初,该程序在中国棋类网站上以“大师”(master)为注册帐号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩。
2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。
围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平,在goratings网站公布的世界职业围棋排名中,其等级分曾超过排名人类第一的棋手柯洁。
阿尔法围棋系统主要由几个部分组成:
一、策略网络(policy network),给定当前局面,预测并采样下一步的走棋。
二、快速走子(fast rollout),目标和策略网络一样,但在适当牺牲走棋质量的条件下,速度要比策略网络快1000倍。
三、价值网络(value network),给定当前局面,估计是白胜概率大还是黑胜概率大。
四、蒙特卡洛树搜索(monte carlo tree search),把以上这三个部分连起来,形成一个完整的系统。
阿尔法围棋(alphago)此前的版本,结合了数百万人类围棋专家的棋谱,以及强化学习的监督学习进行了自我训练。
alphagozero的能力则在这个基础上有了质的提升。最大的区别是,它不再需要人类数据。
也就是说,它一开始就没有接触过人类棋谱。研发团队只是让它自由随意地在棋盘上下棋,然后进行自我博弈。
alphagozero使用新的强化学习方法,让自己变成了老师。系统一开始甚至并不知道什么是围棋,只是从单一神经网络开始,通过神经网络强大的搜索算法,进行了自我对弈。
随着自我博弈的增加,神经网络逐渐调整,提升预测下一步的能力,最终赢得比赛。更为厉害的是,随着训练的深入,阿尔法围棋团队发现,alphagozero还独立发现了游戏规则,并走出了新策略,为围棋这项古老游戏带来了新的见解。
也就是说糖糖要挑战的是最终最强的阿尔法狗。但有个优势就是,最强版本的阿尔法狗其实也是一种自我学习状态。但作为真正的人工智能,糖糖是站在一个全新的高度来俯视的。
唐玄生想了想,毕竟也是一亿的赌局,索性让糖糖去香江和孙小圣一起进行封闭训练。也让孙小圣学习一下围棋,同时也是个最好的对手,看看两人究竟谁更厉害。
毕竟孙小圣才是终极版的完美人工智能。但孙小圣这个模样显然是不适合参加比赛的。所以作为最佳陪练肯定是合格的。
比赛是五局三胜,第一局在金陵举行,后面的都在香江举行。董诗云听到消息索性和宋亚男开了外围,也就是和几大赌球集团合作,哪怕你不懂围棋也可以像赌球一样买糖糖胜利还是阿尔法狗胜利。
本来很多人都是认为明显的唐玄生是钱太多用一亿来做广告。但现在有了这个外围,似乎一切变的有趣起来。
本来都是看好阿尔法狗胜利的,开始开出的赔率也不是很高,但这个赔率是可以调整的。很多人不明白这一点,以为赔率是固定不变的。
起初糖糖的赔率是一赔五,阿尔法狗的赔率是一赔一点五。其实这个是董诗云故意的,不然吸引不了更多人来买。
而且说是合作,真正的外围账户还是董诗云和宋亚男这边的,反正现在有安迪帮忙,也不怕赖账。
当然,那些赌球集团看董诗云宋亚男的表情也是一副人傻钱多的样子。甚至他们宁愿把接下的单子都打到她们的账户。自己都买了很多阿尔法狗第一局胜的外围。
但赌徒的心理永远是无法猜测的。哪怕是随便网络上搜索就可以看到阿尔法狗的战绩,但还是有人愿意买糖糖胜。
这也是董诗云把糖糖胜的赔率放在一赔五而不是一赔十或者更多的原因。也是怕万一会有人大额购买。
当然,这个是要为期一个月才举行比赛的。至少目前买糖糖胜的是寥寥无几,只有买阿尔法狗的万分之一。也就是说如果糖糖胜利的话,董诗云和宋亚男是赚大了。
当然亏的话也是个惊人的数字。但有圆晶厂和催化剂的担保,反而更多人参与进来。
相比之下,同样一月后在糖糖和阿尔法比赛完就会举行的玄清杯反而不是很被人重视。但对于职业棋手而言,无疑是多了一些期待。
因为这次的对局费都是超高的,哪怕是预赛的对局费即使是输也有几万对局费,这直接就是增加荷包的事情。
而且进入八强的话,哪怕是最后第八奖金也是和现在世界大赛冠军奖金一样的。这直接让人惊叹唐玄生的财富和底气。
其实这次外围糖糖胜利的话那些钱就完全可以继续玄清杯比赛而且是用不掉了。因为短短几天的博彩就超过十亿了!
宋亚男笑道:“要是这次糖糖输给了阿尔法狗,估计唐玄生得偷偷哭了。最后的博彩我估计得有千亿,这赔的话还真的是让人心疼。”
孙小圣道:“糖糖不是要来这边吗?我好好教教她,正好我这几天也学了围棋,其实完全不用担心的。我虽然不去比赛,但可以给她支持,我可以和她对接,让她的大数据更流畅,算法更优化。到时候妈妈偷偷抱着我就可以了。而且在现场我也可以观察局面帮糖糖一起分析。”
宋亚男笑道:“也是,我都忍不住买了糖糖赢呢。”
董诗云道:“你买这个有意思吗?都是自己口袋的钱?”
宋亚男道:“毕竟是一个战壕的啊,支持一下。”
董诗云道:“关子清还弄了个玄清杯出来,要不我们在香江也举行个围棋大赛,索性业余和职业都来。我记得业余的世界大赛好像都没有呢。我们把奖金也定的高高的,让业余强豪也有对局费和高额奖金,我大气一点,直接叫紫荆杯,反正比赛广告这些宣传都是我们这边的。宝岛那边出了个林海峰和张羽,我就不信香江这么大没有围棋天赋好的围棋少年。”
宋亚男笑道:“这样好,也容易得多官方和民间的双向支持。就叫紫荆杯世界围棋职业暨业余最强者比赛。”
其实世界围棋业余大赛也是有的,不过开始华夏都是职业棋手参加,1979年聂卫平获得冠军。从1979年以降,至1990年先后有邵震中、曹大元、马晓春、王群、汪见虹、张文东、车泽武、常昊以专业棋手的身份参加,并获得了冠军。
从1990开始才是真正的业余棋手参赛,但比赛是采用积分循环未必合理,宋亚男和董诗云设想的这个是完全向职业比赛看齐的制度。
特别是阿尔法狗完败人类棋手后,这个问题更是争论不休。以前是争论黄龙士范西平相当于现在几段,现在是争论黄龙士吴清源能否战胜阿尔法狗。
阿尔法狗是个围棋软件,几乎输入了所有的古今中外的围棋高手对局,也是如此,想战胜的情结也能理解。
关公战秦雄是相声里面的段子,其实就是健在的棋手,也是没办法比较的。
一个时代有一个时代的骄傲。聂卫平现在肯定赢不了当下的九段,但要是中日擂台赛的巅峰状态呢?
曾经石佛李昌镐现在还不是想赢一盘都难,似乎结婚后水平就江郎才尽了。当然还有同时期的常昊,索性做官了。
围棋学起来恨简单,基本规则一天就可以明白。想到这个唐玄生问糖糖:“你有把握吗?”
糖糖道:“这个月我把死活定式手筋官子都看一遍,应该就可以了。还有那个阿尔法狗的全部对局,知己知彼百战百胜。我要评估一下他的水平和弱点。”
关子清听出了一些关键:“那就是说,你还不会下棋?我的天啊!”
糖糖道:“这个和赢棋有关系吗?其实我多数时间是在推导所有的组合概率。这个才是关键。现在把所有排列组合演化出来,去掉大量明显不合理的。然后阿尔法狗也是注定要输的。”
唐玄生明白糖糖的意思,就是了解围棋死活定式手筋这些基本概念后,她要把所有的可能性用棋路树的方法全部推导出来。
所谓棋路树,就是把所有的下法想象成一棵大树,从第一步开始,你有三百六十一个选点,这就相当于棋路树上面从底部生长出三百六十一个分叉。然后对方的选点就变成了三百六十个,这等于又多出三百六十个分叉。
这样类推下去,所有的下法就像是一棵参天大树。
当然,现在人类的计算机还没有这么大的算法可以支撑。但对糖糖或者孙小圣而言,这显然不是什么问题。
就好比原来一本书很占面积,但用电脑保存的话,一个小小的u盘就相当于一个图书馆的书籍总量。
对糖糖而言,就是更进一步。
而且全部推导出来之后,这样的下棋其实已经是个bug了。想想你认真思考的下法在糖糖眼里仅仅是必然的可能性的一种。也就是说除非你每一步都是最正确的,但这显然不可能。
当所有的可能性都推导出来后,糖糖就会进行算法优化,也就是把下法进行评分,每一步后双方的输赢概率。
其实这是围棋选手的一个基本功,就是判断局势。但人类的判断是一种模糊判断,这个判断的高低客观上决定了水平的高低和最后的输赢。
围棋比赛经常会有高手解说,譬如这么走会是黑好,或者盘面白优势这些说法。但这个都是很模糊的,除非是盘面相差很大。但那种就是业余棋手都能看出来了。
唐玄生想了想道:“这个想法好,等你推导出来了记得把最优化的走法走个一局然后给我瞧瞧。等以后也公布出去,让他们知道什么叫完美的一局棋。”
兰姐好奇道:“你的大脑会特异功能吗?这么厉害,那可是1的后面好多0呢!”
关子清道:“那这样的话,第一局放在金陵吧。也给公司做个宣传。一个亿的彩头,想不火都难。要不,干脆趁机举办个世界围棋大赛,邀请等级分前五十的高手和世界各地选派的高手参加。”
唐玄生道:“那就我们名字都出一个字,叫玄清杯吧。奖金直接比现在的大赛都高一倍,然后参加预赛的就有对局费,越往后对局费就直接翻倍。”
糖糖道:“主人那我就把冠军赢回来。”
唐玄生想了想道:“你参加第一届的,后面就让别人去比赛吧。不过你想的话国际上有许多比赛,你可以弄个大满贯然后隐退。不然对那些棋手不公平。”
想想将来你怎么走都在人家的意料之中,就像打牌,无论你出什么都是大你的,这还这么玩。
理论上说,围棋其实就是你的每一步选点都要是效率最大的。但实际上不太现实,因为还有急所的限制。也就是你譬如走个星,但现在涉及死活了,就不能放弃去占那些效率最大的点。
就是如何在全局和局部之间找到那个最大的平衡点。
唐玄生也有些好奇真正最后糖糖拿给自己的棋谱会不会是像古代传说中那些仙人的棋谱。
古代有些棋谱明显的看的出来和当时的下法天差地别,这说明还是有厉害的脑洞大开的世外高人的。
很快辣椒萝卜和圆晶厂的官网上面就登出了圆晶厂拿出一亿彩头挑战阿尔法狗的新闻。这甚至还导致股价波动了一下,当然还有后续的辣椒萝卜圆晶厂,也就是唐家举办的玄清杯世界围棋大赛。
超高的奖金往往才能出现精彩对局,也就是重赏之下必有勇夫。
其实早在2017年5月,在柯洁与阿尔法围棋的人机大战之后,阿尔法围棋团队宣布阿尔法围棋将不再参加围棋比赛。2017年10月18日,deepmind团队公布了最强版阿尔法围棋,代号alphago zero。
也就是说人家算是功成身退了,糖糖真正要挑战的应该是最强版的阿尔法狗。
阿尔法围棋(alphago)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,由谷歌(google)旗下deepmind公司戴密斯?哈萨比斯领衔的团队开发。其主要工作原理是“深度学习”。
2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜。
2016年末2017年初,该程序在中国棋类网站上以“大师”(master)为注册帐号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩。
2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。
围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平,在goratings网站公布的世界职业围棋排名中,其等级分曾超过排名人类第一的棋手柯洁。
阿尔法围棋系统主要由几个部分组成:
一、策略网络(policy network),给定当前局面,预测并采样下一步的走棋。
二、快速走子(fast rollout),目标和策略网络一样,但在适当牺牲走棋质量的条件下,速度要比策略网络快1000倍。
三、价值网络(value network),给定当前局面,估计是白胜概率大还是黑胜概率大。
四、蒙特卡洛树搜索(monte carlo tree search),把以上这三个部分连起来,形成一个完整的系统。
阿尔法围棋(alphago)此前的版本,结合了数百万人类围棋专家的棋谱,以及强化学习的监督学习进行了自我训练。
alphagozero的能力则在这个基础上有了质的提升。最大的区别是,它不再需要人类数据。
也就是说,它一开始就没有接触过人类棋谱。研发团队只是让它自由随意地在棋盘上下棋,然后进行自我博弈。
alphagozero使用新的强化学习方法,让自己变成了老师。系统一开始甚至并不知道什么是围棋,只是从单一神经网络开始,通过神经网络强大的搜索算法,进行了自我对弈。
随着自我博弈的增加,神经网络逐渐调整,提升预测下一步的能力,最终赢得比赛。更为厉害的是,随着训练的深入,阿尔法围棋团队发现,alphagozero还独立发现了游戏规则,并走出了新策略,为围棋这项古老游戏带来了新的见解。
也就是说糖糖要挑战的是最终最强的阿尔法狗。但有个优势就是,最强版本的阿尔法狗其实也是一种自我学习状态。但作为真正的人工智能,糖糖是站在一个全新的高度来俯视的。
唐玄生想了想,毕竟也是一亿的赌局,索性让糖糖去香江和孙小圣一起进行封闭训练。也让孙小圣学习一下围棋,同时也是个最好的对手,看看两人究竟谁更厉害。
毕竟孙小圣才是终极版的完美人工智能。但孙小圣这个模样显然是不适合参加比赛的。所以作为最佳陪练肯定是合格的。
比赛是五局三胜,第一局在金陵举行,后面的都在香江举行。董诗云听到消息索性和宋亚男开了外围,也就是和几大赌球集团合作,哪怕你不懂围棋也可以像赌球一样买糖糖胜利还是阿尔法狗胜利。
本来很多人都是认为明显的唐玄生是钱太多用一亿来做广告。但现在有了这个外围,似乎一切变的有趣起来。
本来都是看好阿尔法狗胜利的,开始开出的赔率也不是很高,但这个赔率是可以调整的。很多人不明白这一点,以为赔率是固定不变的。
起初糖糖的赔率是一赔五,阿尔法狗的赔率是一赔一点五。其实这个是董诗云故意的,不然吸引不了更多人来买。
而且说是合作,真正的外围账户还是董诗云和宋亚男这边的,反正现在有安迪帮忙,也不怕赖账。
当然,那些赌球集团看董诗云宋亚男的表情也是一副人傻钱多的样子。甚至他们宁愿把接下的单子都打到她们的账户。自己都买了很多阿尔法狗第一局胜的外围。
但赌徒的心理永远是无法猜测的。哪怕是随便网络上搜索就可以看到阿尔法狗的战绩,但还是有人愿意买糖糖胜。
这也是董诗云把糖糖胜的赔率放在一赔五而不是一赔十或者更多的原因。也是怕万一会有人大额购买。
当然,这个是要为期一个月才举行比赛的。至少目前买糖糖胜的是寥寥无几,只有买阿尔法狗的万分之一。也就是说如果糖糖胜利的话,董诗云和宋亚男是赚大了。
当然亏的话也是个惊人的数字。但有圆晶厂和催化剂的担保,反而更多人参与进来。
相比之下,同样一月后在糖糖和阿尔法比赛完就会举行的玄清杯反而不是很被人重视。但对于职业棋手而言,无疑是多了一些期待。
因为这次的对局费都是超高的,哪怕是预赛的对局费即使是输也有几万对局费,这直接就是增加荷包的事情。
而且进入八强的话,哪怕是最后第八奖金也是和现在世界大赛冠军奖金一样的。这直接让人惊叹唐玄生的财富和底气。
其实这次外围糖糖胜利的话那些钱就完全可以继续玄清杯比赛而且是用不掉了。因为短短几天的博彩就超过十亿了!
宋亚男笑道:“要是这次糖糖输给了阿尔法狗,估计唐玄生得偷偷哭了。最后的博彩我估计得有千亿,这赔的话还真的是让人心疼。”
孙小圣道:“糖糖不是要来这边吗?我好好教教她,正好我这几天也学了围棋,其实完全不用担心的。我虽然不去比赛,但可以给她支持,我可以和她对接,让她的大数据更流畅,算法更优化。到时候妈妈偷偷抱着我就可以了。而且在现场我也可以观察局面帮糖糖一起分析。”
宋亚男笑道:“也是,我都忍不住买了糖糖赢呢。”
董诗云道:“你买这个有意思吗?都是自己口袋的钱?”
宋亚男道:“毕竟是一个战壕的啊,支持一下。”
董诗云道:“关子清还弄了个玄清杯出来,要不我们在香江也举行个围棋大赛,索性业余和职业都来。我记得业余的世界大赛好像都没有呢。我们把奖金也定的高高的,让业余强豪也有对局费和高额奖金,我大气一点,直接叫紫荆杯,反正比赛广告这些宣传都是我们这边的。宝岛那边出了个林海峰和张羽,我就不信香江这么大没有围棋天赋好的围棋少年。”
宋亚男笑道:“这样好,也容易得多官方和民间的双向支持。就叫紫荆杯世界围棋职业暨业余最强者比赛。”
其实世界围棋业余大赛也是有的,不过开始华夏都是职业棋手参加,1979年聂卫平获得冠军。从1979年以降,至1990年先后有邵震中、曹大元、马晓春、王群、汪见虹、张文东、车泽武、常昊以专业棋手的身份参加,并获得了冠军。
从1990开始才是真正的业余棋手参赛,但比赛是采用积分循环未必合理,宋亚男和董诗云设想的这个是完全向职业比赛看齐的制度。