柯洁首战告负!搜狗王小川:AlphaGo2.0更接近人 重新描绘智慧边界

  • 日期:01-11
  • 点击:(626)


5月23日下午,中国围棋高峰会议今天在浙江桐乡拉开帷幕。DeepMind的机器程序AlphaGo与世界排名第一的围棋手高杰开始了为期五天、三场的比赛。

比赛的第一天,搜狗CEO王小川评论了阿尔法围棋和柯杰之间的人机大战。

他表达了自己对阿尔法围棋(AlphaGo)变化、比赛最大亮点和比赛意义的看法。

王小川最后说阿尔法狗2.0告诉我们,如果有合适的条件,可能会有其他的生命进化途径和更不同的进化结果。让我们欢呼人类智慧创造了阿尔法狗(AlphaGo),这也帮助我们睁开眼睛,看到我们离最终的生命形式和智慧还很远。保持敬畏,坚定前进,你最终会成功的。

以下是搜狗首席执行官王小川在智湖表达的观点:

时间终于到了。

AlphaGo一年前发行。读完这篇论文后,我在《智湖》上发表了一篇论文,预测这台机器将打败人类。业内许多朋友都不相信,所以我征收了很多“智商税”。此后,微信一直发送红包,直到春节。此外,我还做了两个断言:一是谷歌有可能再次开发AlphaGo 2.0,摆脱“监督学习”,不再需要人类玩围棋的历史数据,而只有通过“强化学习”,两个AlphaGo才会通过自我竞争学会如何下棋并达到顶峰。从公共信息来看,这是真的。这意味着什么?最突出的是什么?

主要技术改进:不同于1.0原则,更接近人类

AlphaGo 1.0是三种算法的巧妙结合:蒙特卡罗树搜索监督学习增强学习。蒙特卡罗树搜索(Monte Carlo Tree Search)是一种优化的暴力计算,比深蓝1997年的暴力计算更聪明。这里的监督学习是通过学习人类棋谱的3000万步来模仿六个或更多职业棋手的规则,这也是AlphaGo取得突破性进展的关键算法。作为帮助,两名阿尔法围棋手从自己的对手那里学习如何下棋。据报道,他们下棋的能力有限。

根据公开信息,推测这次AlphaGo2.0的技术原理与上一次大不相同:

1。他放弃了监督和学习,没有再接受3000万轮象棋比赛的训练。这是AlphaGo最辉煌的算法,也是当今主流机器学习不可避免的核心条件:依靠高质量的数据,在这个特定的问题下再次突破。

2。放弃蒙特卡罗树搜索,停止暴力计算。理论上,算法越愚蠢,就越需要暴力计算作为补充。算法越聪明,计算就越不激烈。从AlphaGo 2.0的“马甲3”大师的历史行为来看,象棋走得非常快,每10秒走一步,这很可能放弃暴力的计算。

3。它大大加强了加强学习的作用。以前打鼓的算法已经正式成为主要玩家。想想这是多么鼓舞人心:两台愚蠢的机器,遵循下棋和获胜的规则,不分昼夜地随机下棋,总结经验,不断地批评和自我批评,最终在一周内成为一名大玩家。

在这样的算法下,AlphaGo 2.0对计算资源的开销非常小。当前象棋游戏被输入到神经网络,电流流过,并且输出是最好的象棋游戏方案。我想在这样的算法下,只在一个图形处理器上工作是可能的,并且每次移动消耗的能量接近人脑。

最大的吸引力:AlphaGo2.0完全脱离了人类的经验。

今年早些时候,AlphaGo化身为大师,作为顶尖的人类棋手,连续赢得60场比赛。在围棋领域,机器的胜利已经成为公认的结论。这导致许多人问:这场人机战争还有意义吗?我们的焦点不再是机器是否会赢,而是机器会用什么姿势来打败人类。

阿尔法围棋(AlphaGo)学了3000万步人类象棋,他下棋的风格与人类相似。在比赛现场,阿尔法狗(AlphaGo)有时被认为“愚蠢”,因为他的经历与其他人不一致。然而,在中场休息后,他发现机器逐渐占了上风,并最终获胜。为了证明自己并将其解释为“阿尔法围棋中盘逆转”,前两盘的情况并非如此。第三盘开始时,评论员吸取了教训,开始以欣赏和敬畏的心情尊重阿尔法围棋(AlphaGo)为“老师A”。这给围棋世界带来了巨大的影响。人们过去认为正确的实际上是不正确的。柯杰曾评论道:“阿尔法狗(AlphaGo)出现,许多理论被推翻,看着以前的公式变得有趣,失去这么多眼睛不再是两点。”经过几千年的实战,人类总结了围棋理论,然后计算机告诉人类,所有这些都是错误的。目前,在许多比赛中,人类棋手已经开始向机器学习,模仿阿尔法围棋(AlphaGo)。棋圣聂卫平曾经说过“理论已经被颠覆”。

和AlphaGo2.0脱离了机器对人类的模仿,下棋的风格将完全脱离人类的模式。在与柯杰的比赛中,意想不到的动作会不断出现,这些动作在教科书中会被视为低级错误或完全不合理。任何普通玩家都不会这样玩,任何新手都会被指示这样玩。AlphaGo2.0将继续创造这种局面。关键是他是对的。你能想象职业棋手会有多震惊吗?你一生中不仅从未想过玩这样的游戏,整个围棋世界也从未想过。你怀疑你已经白活了吗?你会重新考虑为什么围棋在2000年的发展会有这样的瓶颈吗?有多少海洋和天空等着我们去探索?迫不及待地等着我们去探索,电脑给出了最终答案,多么失望。

我们将讨论什么是阿尔法围棋。然而,可以推断,任何流派或风格都有其局限性。只有当所有的流派都统一起来,看不到任何流派时,一个人才能达到更高的水平。AlphaGo 2.0将是这样一台机器,没有风格,像岩石一样稳定。

可想而知,这款与柯洁的游戏可以频繁展示“奇怪的动作”,彻底颠覆人类对围棋的理解。这将是游戏最大的吸引力。英雄柯杰,解锁108个阵地进行抵抗。

2017人机战争的意义:取代进化史,重新理解智慧的边界

2016年,在阿尔法狗(AlphaGo)和李师义(alphaGo)之间的战斗之后,人工智能进入了公众的视野,我们开始重新思考机器和人类之间的关系。

围棋有2000多年的历史。在长期的思考中,围棋理论不断发展,达到了一个很高的水平。阿尔法狗(AlphaGo)的胜利可以解释为“照耀你”。毕竟,它已经在人类围棋进化的主要道路上达到了一个新的高峰。

AlphaGo2.0完全放弃了过去2000年围棋中人类进化的经验,找到了另一条道路。只有通过从两台机器玩的游戏中学习和进化,它不仅超越了人类进化的速度,而且还发展了一种完全不同的下棋方法,更接近完美的状态,实现了人类的毁灭,重演了围棋的进化史,并从这2000年中获得了不同的进化结果。

这会给我们带来什么?如果你跳出围棋的规则,用类推的方法来观察地球上生命的进化:人类逐渐从原始生物变成灵长类动物,变成单细胞,并发展出超越所有其他生物的智慧。这条路是唯一的吗?人类生命形式离最高生命形式有多远?

AlphaGo告诉我们:我们仍然有很大的发展空间;阿尔法狗2.0告诉我们,如果有合适的条件,完全有可能有其他的生命进化路径和更多不同的进化结果。

让我们为人类智慧创造了阿尔法狗而欢呼吧,它也帮助我们睁开眼睛,看到我们仍然远离最终的生命形式和智慧。

保持敬畏,坚定前进。你会成功的。