<tbody id='gezsod1g'></tbody>

  • <small id='zt1yq661'></small><noframes id='5u98o3le'>

  • 您当前的位置:主页 > yy棋牌手机下载 >

    FG棋牌官方-第三代AI赌神在六人桌首次击败顶级职业扑克玩家

    发布时间:2020-09-05 12:11编辑:admin阅读(

      第三代AI赌神在六人桌首次击败顶级职业扑克玩家

      一月,人工智能程序Libratus在1个对1无限扑克游戏中成功击败了4名顶级职业玩家。但是人们一直认为,多人德克萨斯扑克对AI来说是一项更加艰巨的任务。

      但现在,这个任务已经实现!

      卡内基梅隆大学和Facebook于7月12日在《科学》杂志上发表了一篇论文 说他们共同开发的德国蔚蓝棋牌正规吗扑克人工智能Pluribus在六手无限扑克中击败了顶尖的人类玩家。

      包括Darren Elias, 他赢得了4个WPT(世界扑克巡回赛)冠军, 和耶稣克里斯·弗格森, 他有6条WSOP(世界扑克巡回赛)手镯。还有迈克尔·加利亚诺, 在他的职业生涯中赚了将近200万美元。

      从左至右:DarrenElias, 克里斯·弗格森 迈克尔·加利亚诺

      无论是对抗5名顶尖人类玩家的多形龙,仍然有五个Pluribus混战顶尖人类玩家,10点以后000手它的性能将大大优于人类。

      Pluribus是一个拉丁词,面向公众的手段 Epluribusunum”一词印在美国的国徽上。给这个名字它无疑证明了这是世界上第一款在多人扑克中超越人类职业玩家的AI。

      Pluribus在多人扑克领域取得了超人的成就,这是人工智能和博弈论领域公认的里程碑。Tuomas Sandholm说, 卡内基梅隆大学计算机科学教授。TuomasSanholm和他的学生博士 NoamBrown(目前在facebookAI项目团队中工作)共同开发了Pluribus。

      Tuomas Sandholm(左)和他的学生NoamBrown

      1

      第三代AI赌神诞生了

      几十年来扑克一直是人工智能领域的一个困难而重要的挑战。原因是,扑克包含隐藏的信息,换一种说法,你不知道对手的牌。为了赢得扑克,您需要虚张声势(吓care)或使用其他策略,在国际象棋游戏中通常不需要这样做。这使得在扑克中应用人工智能非常困难。

      1979年,那时候, 刷卡机器人连续抽水

      早在四月到五月克劳迪科 由NoamBrown和TuomasSandholm开发的第一个德国扑克计划,在匹兹堡, 他们轮流与四位顶级人类大师一起, 包括道格·波克, 当时在世界排名第一。比赛持续了13天,一共20000手。但是刚起步的Depu AI排在进度的一半,大约是460人类落后了000筹码到底, 他以约730的劣势返回,000筹码。

      DougPolk

      但是在一月份天秤座 由NoamBrown和TuomasSandholm共同开发的人工智能程序,在持续20天的1对1无限德国扑克游戏中,成功击败了全球4名顶级职业玩家。Go之后也是如此另一个里程碑事件是AI捕获了非常困难的游戏。

      这时人工智能已经学会虚张声势,您会看到人类玩家的虚张声势。

      但是从1对1到6人对决,人工智能取得了哪些进展?

      尽管这似乎是一个从两个到六个的渐进过程,但这实际上是一个巨大的挑战,朱利安(Julian Togelius)说, 纽约大学助理教授,研究游戏和人工智能。研究多人游戏,以前没有出现在所有游戏中。

      据报道由Facebook和卡内基梅隆大学设计的比赛分为两种模式:1位AI + 5人玩家和5位AI + 1人玩家。Pluribus在两种模式下均获胜。如果筹码价值$ 1,Pluribus平均每局赢取$ 5,您可以赢得$ 1,一小时内与5位人类玩家对抗000次。职业扑克玩家认为这些结果是决定性的胜利优势。

      实验中Pluribus与人类玩家的界面

      这是AI首次在大型基准游戏中击败顶级职业玩家,而大型基准游戏的玩家(或团队)数量大于2。

      2

      Pluribus可能会改变职业扑克玩家的游戏方式

      出奇,Pluribus首先逐步学习如何通过面对自己来使扑克对自己有利。

      Pluribus的核心策略是通过自我学习来学习。在这个过程中人工智能与自身竞争不使用任何人类游戏数据作为输入。AI首先随机选择游戏方式,然后,在决定行动的每个步骤之后,逐步提高效果,并将概率分布拟合到这些动作。最后,人工智能将比以前的策略表现更好。

      DarrenElias说:它的最大优势是能够使用混合策略。这就是人类想要做的。对人类而言重要的是,以完全随机的方式执行-混合策略,并始终保持一致。大多数人无法做到。

      与顶级玩家比赛时,Pluribus的筹码数量会发生变化。直线代表实际结果,虚线代表一个标准偏差。

      不料,Pluribus比专业玩家更经常使用donkbets。职业扑克玩家通常认为此赌注很弱。

      克里斯·弗格森(Chris Ferguson)在游戏实验后说: Pluribus非常难以应对!我们很难直视它。它不仅擅长进行小额投注,他擅长从好手获得最大的价值。

      Dr. 布朗说,Pluribus的某些策略甚至可能改变职业球员的比赛方式。

      扑克 游戏 斗牛棋牌是什么 杰克棋牌下载网站 湖南棋牌 FG棋牌官方
        <tbody id='09mlg7of'></tbody>

    • <small id='vsqk3642'></small><noframes id='3a8keoud'>

      <tbody id='6w2a3r5n'></tbody>
  • <small id='byd9pxv7'></small><noframes id='xj6cfeh0'>