长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

中國學霸隊迎戰美國德撲AI,李開復稱這是人類最后獲勝機會

澎湃新聞見習記者 虞涵棋
2017-04-05 18:33
來源:澎湃新聞
? 能見度 >
字號

“雖然人類只有10%左右的勝率,但是10%其實挺高的了。柯潔對陣阿爾法狗,勝率是0。所以不要去看圍棋了,還是看我們的德撲吧,希望這次我們人類能最后一次戰勝人工智能”,4月5日,創新工場CEO李開復在北京創新工場總部舉行的德州撲克人機大戰表演賽賽前發布會上說道。

而李開復口中的這個勝率達到90%的大BOSS,名叫Libratus,是一個擅長打德州撲克的美國AI。今年1月份,它在匹茲堡的大河賭場對陣4名頂尖職業玩家大殺特殺,加冕AI賭神。這次,它將來到中國“踢館”,和6位中國高手過過招,并取了一個武俠風的中文名字——“冷撲大師”。

這6名中國頂尖德州撲克玩家組成的中國“龍之隊”,由2016年獲得世界撲克系列賽WSOP冠軍的隊長杜悅領銜。杜悅在發布會上回答澎湃新聞(www.usamodel.cn)的提問時表示,龍之隊在清明小長假期間做了非常充分的準備工作,“基于我們對于人工智能的了解,我們相信,雖然說冷撲大師是AI在德撲領域的巔峰之作,應該是取得了非常大的成就,但是離計算機科學和人工智能能夠達成的理論水平,還有一定的距離。就像李開復老師講的,AI超越人類是遲早的事,不是這一次就是下一次。我們只是有個小小的夢想,希望中國龍之隊是最后一支戰勝AI的團隊。”

創新工場CEO李開復與中國“龍之隊”隊長杜悅

200萬元獎金,36000手牌

冷撲大師將于4月6日到10日間在海南澄邁生態科技園與中國“龍之隊”進行一場德州撲克人機大戰表演賽,而主辦方為此項賽事開出的獎金是200萬元人民幣。

在為期5天的比賽中,龍之隊的6名玩家將每天進行上下兩場共計10個小時、1200手牌的高強度比賽,且每次同時玩兩手牌。而對“冷撲大師”來說,就是同時處理12手牌。在36000局比賽后,主辦方通過統計玩家累積的總籌碼來判決勝負。

圖解德州撲克人機大戰表演賽賽制

值得一提的是,為了降低發牌中的運氣因素,比賽將采用復式對稱發牌的方式。6名人類玩家兩兩配對,被拆分為兩組,在兩個獨立的房間中與AI對陣。每一名人類玩家和AI對陣的手牌,都會對調為其配對人類玩家比賽時AI的手牌。

“冷撲大師”的必殺技在殘局

“冷撲大師”的開發者是美國卡內基梅隆大學(CMU)的計算機系教授托馬斯?桑德霍姆(Tuomas Sandholm)和其研究生諾姆?布朗(Noam Brown)。它的拉丁語名字Libratus意為“均衡的”。這是因為納什均衡為Libratus的算法提供了重要源泉。

今年1月10日到1月30日,在為期20天、共計12萬手的一對一無限注德州撲克比賽中,Libratus壓過Jason Lee、Dong Kim、Daniel McAulay 和Jimmy Chou這4名CMU精心遴選出的頂尖高手,共計贏得176萬美元籌碼。

不過冷撲大師這次雖然“身”在中國,“心”卻仍在匹茲堡。同在大河賭場的比賽一樣,匹茲堡超算中心會繼續承擔AI的計算處理任務。

雖已加冕AI賭神,桑德霍姆團隊目前還沒有揭曉“冷撲大師”的全部秘密。現在有限的信息是,它在牌局初期會采用近似轉化的方法來減少計算量,而殘局階段才是Libratus真正發威的時候:殘局階段計算量更少,計算機可以做到實時計算。

以納什均衡為代表的博弈論是德撲算法的核心,即AI的目標是找到一個無論對方走哪一步,自己都不會產生損失的策略。在博弈論中,像一對一撲克這種零和游戲永遠存在這樣的最優解,就像在經典的博弈論模型“囚徒困境”中,招認罪行就是一個無論對方招認不招認都最優的策略。人類高手可能會利用對手的犯錯來獲得更大的利益,但對AI就毫無辦法。因為AI只會按計算所得的最優策略決策,不受對手的干擾。

這也解釋了與其交手過的人類玩家對AI的一個評價:Libratus在比賽中表現出了高水平的詐唬和反詐唬。畢竟,AI對人類對手的“演技”可是視而不見的,它們“滿腦子”都是數學。對AI來說,詐唬只是一種讓對手猜不透自己手牌的數學手段。

如果說阿爾法狗是IQ天才,冷撲大師就是EQ專家

擁有CMU雙博士的李開復在看到Libratus的消息后立馬萌生了邀請德撲AI來華比賽的想法。他說道,從1983年起,他就開始做人機對弈。1988年,CMU開發的“奧賽羅”擊敗了黑白棋世界冠軍,其中就有李開復的貢獻。

“我覺得我比較懶,我花了一個暑假做了這個東西,我師兄花了15年做出了‘深藍’,這就是我和這個領域的淵源和故事”,李開復回憶道。1997年,IBM的計算機“深藍”擊敗了國際象棋棋壇神話卡斯帕羅夫。

國際象棋棋壇神話卡斯帕羅夫不敵IBM的“深藍”

此后,人類見證了人工智能在棋類領域上的所向披靡,而在過去的一年間挑落中日韓三國頂尖圍棋手的阿爾法狗無疑奏響了最強音。這些被人工智能攻克的棋類都是“完美信息”游戲,所有玩家在游戲中能獲得的確定性信息是對稱的。人工智能掌握這些游戲的難度,主要取決于游戲的決策樹(decision tree)上的決策點(decision points)數量,這決定了計算機在決策樹上的搜索強度。圍棋是上述幾種棋類中決策點數量最多的,因而也是最后被人工智能掌握的。

“奧賽羅是第一個打敗世界冠軍的人機對弈系統,搜索難度是10的十幾次方;到了深藍是10的四十幾次方,這是30個數量級的提升,從計算機的角度來說了不得。大家當時都說圍棋(的搜索量)是10的172次方,這要再提升140個數量級,至少是25年之后的事”,李開復說道。

盡管最終阿爾法狗的橫空出世沒有花上25年,但李開復認為,圍棋在本質上依然是一個純粹的搜索問題,這種前提下人類早就沒有贏的希望,只是時間的問題。但撲克是完全不同的。

德州撲克是一種更接近現實世界的“非完美信息”游戲,玩家只掌握不對稱的信息,他不知道對手手中是什么牌,不知道五張公共牌會開出怎樣的結果,也不知道對手猜測自己握有怎樣的手牌。這些問題在計算范圍之內。

這與我們在現實生活中遇到的很多問題類似:商業談判、網絡安全、出租車自動駕駛、機器人規劃、醫療規劃等。這些問題都需要在 “不完美信息”情景中做出決策,打“心理戰”。

“如果說阿爾法狗是一個IQ超級天才,冷撲大師其實在一定程度上是一個EQ專家。不能說它比阿爾法狗更難,阿爾法狗肯定是搜索空間更大、速度更快。但冷撲大師來到了另一個游戲層次——心理游戲的層次”,李開復總結道。

“學霸”組成的中國龍之隊

雖然冷撲大師在美國完勝4名頂尖高手,但李開復認為這次中國龍之隊比起美國團隊有一個獨特的優勢:4名美國高手是以德撲謀生的職業玩家,而中國龍之隊的成員大多具有金融和計算機背景,可以說是一支“知己知彼”的“學霸”戰隊。

澎湃新聞(www.usamodel.cn)梳理中國龍之隊隊員的基本信息如下:

隊長杜悅:畢業于清華大學計算機系,現任常春藤資本基金合伙人,曾任人人集團副總裁,2016年獲得世界撲克系列賽WSOP冠軍;

許朝軍:畢業于清華大學計算機系,點點網、啪啪創始人兼CEO,曾任搜狐技術總監、盛大在線首席運營官。北京國際撲克學校創始人及校長;

張淮:畢業于清華大學計算機系,甲骨文公司高級工程師,德撲深度研究者;

童舟:北京千山劇影視傳媒有限公司董事長兼總經理,2016年WPT China豪客賽第4名;

朱亞希:2012年畢業于浙江大學,被稱為“德撲女神”, 2016年獲得德州撲克澳門百萬賽中國冠軍賽冠軍;

王天建:2006年創辦中國撲克網,2013年帶隊參加國際撲克聯盟(IFP)復式德州亞洲國家杯,最終獲得亞洲國家杯冠軍。

德州撲克人機大戰表演賽即將開賽

除了表演賽正賽之外,4月10日賽事最后一天晚間,各路名人大咖將齊聚海南展開一場別開生面的“冷撲大師名人體驗賽”。負責名人體驗賽的協辦方春光里創始合伙人楚小白介紹,來自科技圈、投資圈、媒體圈等共36位名人嘉賓將參與其中,組成六支名人戰隊來挑戰冷撲大師。創新工場CEO李開復、天神娛樂董事長朱曄、豐厚資本創始合伙人暨春光里創始人楊守彬、知名電視主持人許戈輝、極客公園創始人張鵬、Xtecher創始人戚宗超、知名媒體人陽淼等嘉賓都將悉數到場,親自體驗與機器對打撲克。

上次阿爾法狗大戰韓國棋手李世石時,相信大多數不懂圍棋的觀眾看著棋盤上的黑白交錯宛如看天書。而德撲不同,比起圍棋的“陽春白雪”,它的上手門檻非常低。只要記住不到10種牌型及它們相互之間的大小關系,大家就能搬起小板凳、嗑起瓜子,輕松欣賞這場德撲人機大戰表演賽了。

    校對:徐亦嘉
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            做生意风水知识| 百家乐官网境外赌博| 大发888网址怎么找| 百家乐官网鸿泰棋牌| 中国百家乐软件| 噢门百家乐官网玩的技巧| 任我赢百家乐自动投注分析系统| 鄂托克旗| 皇冠网百家乐啊| 三亚百家乐官网的玩法技巧和规则 | 百家乐官网中的概率| 百家乐官网建材| qq德州扑克怎么玩| 做生意的门市风水| 百家乐官网榄梯打法| 买百家乐程序| 百家乐官网庄闲出现几率| 金都百家乐的玩法技巧和规则| 發中發百家乐官网的玩法技巧和规则| 百家乐官网软件骗人吗| 大发888娱乐场下载远程| 澳门百家乐怎么玩| 澳门百家乐娱乐开户| 属兔魔羯女在哪个方位做生意| 百家乐官网娱乐平台会员注册| 星河娱乐| 神娱乐百家乐的玩法技巧和规则 | 百家乐官网破解打法| 最好的棋牌游戏平台| 百家乐最佳打| 百家乐官网板路| 澳门葡京赌场图片| 易球百家乐娱乐城| TT百家乐现金网| A8百家乐官网游戏| E世博| 威尼斯人娱乐城位置| 百家乐赌法博彩正网| 百家乐官网二路珠无敌稳赢打法| 京山县| 鼎龙娱乐城|