玩德州扑克的“AlphaGo”来了如果你赢了你可以拿走20万美元全球通讯

2023-05-29 16:38:05来源：互联网

从1月11日起，五名顶级德州扑克玩家将在匹兹堡赌场进行角逐，但其中一人不是人类。

在这场名为“人脑vs人工智能”的对决中，四位职业选手、董金、丹尼尔麦考利和周吉米将与卡耐基梅隆大学开发的“天平”人工智能系统展开角逐。为期20天的比赛将对阵12万手牌，奖金为20万美元。

(资料图片仅供参考)

董金在2015年对阵卡内基梅隆大学的克劳迪奥。图片来自：CMU

人工智能对抗人类并不是什么新鲜事，但关键是，这场比赛是德州扑克。

当我们下棋或围棋时，我们可以看到对方的棋子、排列等信息，这被称为“完全信息游戏”。另一方面，德州扑克则不同。每个玩家手里的牌只有自己知道，其他玩家看不到，所以是“不完全信息”。

(图片来自：大众机械)

考虑到德州扑克独特的规则，让AI主宰游戏并不那么容易。简而言之，与桌游相比，德州扑克对AI更具挑战性，也是最近非常热门的人工智能测试项目。

卡内基梅隆大学的天平动采用了一种叫做“纳什均衡”的策略。在这个策略中，只要其他玩家的策略保持不变，单个玩家就无法从改变策略中获益。

天平动所要做的就是识别无望策略，从而更快地找到纳什均衡点。经过反复训练，天平动已经能够忽略那些不好的路径。

然而，天平动并不是唯一能玩德州扑克的AI。就在卡内基梅隆大学宣布天平动的游戏前几天，加拿大阿尔伯塔大学首次发表了一篇关于扑克AI的论文，表明他们的DeepStack是世界上第一个在一对一无限制德州扑克中击败职业扑克玩家的计算机程序。

上周，一篇名为《DeepStack：无限下注扑克里的专家级人工智能》 (Deepstack :无限扑克中的专家级人工智能)的论文出现在著名的论文网站Arxiv上。作者是加拿大阿尔伯塔大学、捷克查尔斯大学和布拉格捷克理工大学的研究员。

论文显示，在有33名人类玩家的44000手大赛中，DeepStack的平均胜率为492 mbb/g。一般认为当数据达到50 mbb/g时，人类玩家获胜的几率会更大，750mbb/g是对手每局都会叠牌的节奏。

值得一提的是，DeepStack玩的是无限注德州扑克，比有限注复杂多了。

然而，尽管DeepStack具有先发优势，但它吸引的注意力显然不如天平动。

卡内基梅隆大学模仿AlphaGo的套路，赌场、机器对抗顶尖人类高手，还有20万美元奖金，显然比DeepStack团队的一篇论文更吸引眼球。

(图片来自：大众机械)

与此同时，一些扑克专家也对DeepStack提出了质疑，认为在对抗DeepStack的玩家中并没有顶级玩家，但天平动不得不面对世界顶级玩家。

至于哪一方最终会拿到20万美元的奖金，我们要等差不多三个星期。

本网推荐

天天消息！采用常压油箱能否实现蒸发排放达标？比亚迪公开回应