概括
- 分析人工智能如何影响扑克游戏
- 最近的 AI vs. 扑克玩家锦标赛和结果
- 麻省理工学院率先开展人工智能对扑克影响的研究项目
- AI 真的比(超过)顶级扑克玩家具有主要优势吗?
从计算机到娱乐场:人工智能如何彻底改变我们所知道的扑克
这篇文章将介绍人工智能和扑克最近相互之间的关系和影响,以及我们认为扑克在未来将如何因机器学习而发生变化。
人工智能 (AI) 系统在学会打败扑克职业选手之前很久就学会了在围棋和国际象棋中打败人类。创建一个能够击败人类玩家的系统很困难,因为扑克是一种需要直觉、推理和策略的游戏。扑克玩家必须使用隐藏的信息来进行下一步行动。尽管存在这些挑战,人们还是开发了能够在扑克中获胜的人工智能系统。
现在让我们看看人工智能系统是如何成功击败职业扑克玩家的。
DeepStack如何掌握无限注德州扑克
来自加拿大埃德蒙顿阿尔伯塔大学的一个团队使用算法和深度机器学习创建了一个人工智能系统,该系统能够在两人德州扑克游戏中击败人类。德州扑克是一种充满诈唬、随机结果和隐藏牌的扑克变体,是任何AI系统最难掌握的。
DeepStack的创建者训练其神经网络掌握超过一千万种游戏情况,因为众所周知,人工智能系统依赖神经网络来确定最佳动作。
DeepStack与来自国际扑克联合会的职业扑克玩家进行了44,852场比赛,结果职业牌手们惨败而归。
Polaris击败人类扑克玩家
阿尔伯塔大学团队于2007年创建了Polaris,在系统中加入了几个固定策略和扑克机器人。他们让计算机程序在玩扑克比赛时可以自由选择这些策略。
2007 年 7 月,Polaris在不列颠哥伦比亚省温哥华的凯悦酒店与职业扑克玩家Ali Eslami和Phil Lak进行了一场战斗。Lak对Polaris来说并不陌生。2005年,他击败了Polaris的祖先VexBot,尽管他后来承认自己很幸运。
在2007年的挑战赛中,人类选手在与Polaris的比赛中取得了2胜1负1平的成绩。
事实证明,2008年版的Polaris更难击败。在拉斯维加斯举行的第二届人机扑克锦标赛的六场比赛中,Polaris赢了三次,输了两次,平了一次。
Polaris是一个令人兴奋的例子,说明研究人员如何在几年内致力于人工智能系统,以改进它并使其成为人类玩家更强大的对手。
Libratus继续吊打人类选手
Libratus是卡内基梅隆大学的 Tuomas Sandholm 和Noam Brown于2017年开发的AI系统,所向披靡。它需要100个中央处理器 (CPU) 才能运行。
该系统参加了一场为期20天的扑克比赛,与四名德州扑克玩家进行了120,000手牌比赛。它击败了人类并赢得了价值180万盈利。
Pluribus 在六人德州扑克中击败人类
机器人Pluribus在六人德州扑克游戏中击败了一些最优秀的扑克职业选手,从而创造了历史。人工智能系统由卡内基梅隆大学的一个团队创建,是第一个在一场比赛中与不止一名扑克玩家对战的系统,这种比赛需要的不仅仅是使用策略来获胜。
Pluribus与五名扑克玩家打了10,000手牌。它的每个对手都在扑克常规桌游戏和锦标赛中赢得了数百万美元。Pluribus每100手牌平均从人类对手那里赢取480,这是大多数扑克职业玩家的目标。
Pluribus 在与职业扑克玩家对战之前已经做了很多工作。系统刻苦练习,和自己对弈了万亿手牌。然后它与一位扑克职业选手一起玩,每当它犯错时,他都会提醒开发团队。
每当收到新信息时,该机器人都会迅速改进。它最初是一名平庸的扑克玩家,但很快成为世界上最好的扑克玩家。它创造了自己独特的风格,并根据比赛情况使用不同的策略来击败它的五个对手。
Claudico自己学习
由 Tuomas Sandholm 教授领导的卡内基梅隆大学毕业生团队承担了一项具有挑战性的任务,即帮助机器人独立学习,而不是使用现有的策略、动作和备选方案进行编程。该项目具有挑战性,因为它需要一台RAM为16 TB的超级计算机。
关于该项目,Sandholm 表示,扑克是AI研究的基准,就像过去的国际象棋一样。Sandholm 表达了他对扑克的看法,他说这是一种复杂的游戏,需要机器根据误导和不完整的信息做出决定,因为“慢玩”和“诈唬”等诱饵。
Claudico准备在 2014 年 7 月表演。该机器赢得了与其他计算机的比赛,但直到2015年才与职业扑克玩家对战。
该系统于4月24日至5月8日与Jason Les、Dong Kim、Doug Polk和Bjorn Li进行了多场单挑比赛。它进行了两场扑克比赛,每天8小时超过750手,达到20,000手每个玩家。目的是创建大量的扑克牌样本,并从游戏中消除运气因素。该机器打了80,000手牌,成为“人类对 AI ”系统比赛中打牌次数最多的机器。
微软和Rivers Casino捐赠了100,000美元的奖金,扑克游戏比赛在网上进行了现场直播。AI与人类比赛的精彩片段还出现在CBS体育频道的“美国扑克之夜”节目中。
人类以732,713记分牌的优势赢得比赛。随后,Polk 表示,AI编程团队必须根据其性能改进 AI 系统。在接受PokerNews采访时,他表示当人类玩家可能下注四分之三或一半的底池时,Claudico会下注总底池价值的10%甚至 1000%。他说人类玩家不会下注19,000来赢得价值 700的底池。
麻省理工学院的扑克人工智能研究
麻省理工学院 (MIT) 也不甘落后,对人工智能进行了多项研究。大多数在线扑克网站不允许使用机器人,但麻省理工学院开发的机器人可以帮助研究人员进行软件开发、编程和人工智能。
麻省理工学院举办扑克机器人锦标赛。麻省理工学院一年一度的扑克机器人赛事有最多四名程序员组成的团队相互比赛,以确定哪个机器人拥有最好的扑克技能。参赛者还应用数学、计算机科学和经济学这些通常不是在学术环境中发展起来的概念来击败对手。
根据麻省理工学院的锦标赛网站,扑克是交易所需的博弈论和决策技巧的主要应用,因为它是一种不确定性和不完全信息的游戏。就像交易者根据有限的市场信息做出决定一样,扑克玩家根据隐藏的信息做出行动。
比赛吸引了多家赞助商并变得激烈(intense ),尽管它与世界扑克系列赛(WSOP)不同。每个程序员团队都必须在一个月内编写一个自主扑克机器人。
2022 年举行的扑克机器人锦标赛的奖金价值超过40,000美元。除了吸引扑克游戏社区的关注外,该活动还吸引了科技公司和量化交易公司的代表。
机器人和人工智能系统比人类玩家有优势吗?
与人类玩家不同,人工智能系统在玩扑克时永远不会输掉任何实质性的东西。输掉一场比赛对机器和机器人没有现实影响。相反,人类玩家如果在玩扑克时输了,就会蒙受经济损失。
机器也无法透露任何物理信息。相反,人类玩家通过面部表情和手势来揭示有关他们扑克手牌的信息。
玩过AI系统的扑克玩家表示,机器不会显示任何他们在诈唬的迹象或信号。然而,对于参加现场扑克锦标赛的人类玩家来说,体征可能会成就或破坏游戏。
当你在玩机器时,社交是不可能的。你不能享受任何闲聊或牌桌谈话。计算机从不说出或透露提供有关其游戏风格信息的口头信息。当人类玩家在玩机器时处于具有挑战性的位置时,他们大部分时间都在猜测。
扑克不是机器游戏。与人类对手比赛比与机器人、机器或人工智能系统比赛更有趣。玩扑克的乐趣在于能够运用策略、智慧和智慧来打败对手。当您与人类对手一起玩时,赢得一场扑克游戏是令人兴奋的。当你玩人工智能系统时,兴奋是不一样的。
玩在线扑克也比玩人工智能系统更令人兴奋,因为你是在和人类对手玩。人工智能系统已经证明了它们优于扑克职业玩家的优势,但它们最不关心游戏的输赢。
机器人击败随机玩家对现实世界没有影响。但是赢得一场与人类对手的比赛会产生很大的不同。到收银台取款的体验无与伦比。
如果我们可以用一句话来概括,我们会说击败人类对手的快感比战胜人工智能系统或机器人更令人兴奋,也更有回报。