?

與AI一起“石頭剪刀布”

2021-10-07 01:42風池
知識窗 2021年6期
關鍵詞:勝率剪刀概率

風池

自從AI出現后,在很多競技類游戲中,人類都敗給了AI,最著名的就是1997年“深藍”擊敗國際象棋大師卡斯帕羅夫事件。對于AI擊敗人類,有些人表示不服,認為AI之所以能擊敗人類,是它掌握了更多的信息,能根據算法預測出人類的“套路”,如果在隨機游戲中,比如“石頭剪刀布”這種沒有規律的游戲,AI不一定贏得過人類。事實真的是這樣嗎?

在人們的一般認知里,“石頭—剪刀—布”三種出法隨機出現,相互克制。每次出手只會有三種結果,即輸、贏和平局,每次玩家獲勝的概率都是三分之一。這種游戲看起來很公平,而且充滿隨機性,所以在生活中,當遇到問題無法解決時,人們便非常樂于通過這種小游戲來做選擇。但是,這種游戲真的是隨機的嗎?答案是否定的。

浙江大學何賽靈教授的研究團隊開發了一個基于馬爾可夫鏈的AI模型,專門用來玩“石頭剪刀布”游戲。游戲的規則是:贏了加2分,平局加1分,輸了不得分。為了確保人類玩家能盡可能地按照自己的想法出拳,杜絕亂選或者放水,游戲設置了金錢獎勵,總分越高,得到的獎勵越多。但是,在與52個人類玩家分別大戰300回合之后,AI擊敗了95%的玩家。在最懸殊的一場較量中,AI獲得了198次勝利,55次平手,僅輸了47次。實驗總計進行了15600次,最終結果表明,在這個游戲中,AI大概率擊敗了人類玩家。如果“石頭剪刀布”游戲真的是隨機的,面對如此大的樣本,AI根本不可能占有優勢。

這里面有什么玄機嗎?確實有。從本質上來看,“石頭剪刀布”屬于博弈問題,其背后蘊藏著經典的納什均衡,而每個個體的習慣、認知和策略都會影響實際勝率。比如你和對手很熟悉,那么你可能知道他(她)經常出布,因此可以多出剪刀來克制??蒲袌F隊提出的AI模型就是利用了類似的原理,證明了“石頭剪刀布”真的存在針對不同個體的長期制勝策略,可以有效提高勝率。

這套AI模型基于n-階馬爾可夫鏈設計,擁有記憶性,能夠向前追溯最多n個歷史狀態并加以利用。為了增加AI的勝率,研究團隊還針對人類玩家的不同性格和策略發明了一套Multi-AI模型。這套模型含有多個錦囊,如果人類玩家連續勝利,就會促使Multi-AI轉向選擇其他AI模型的更優解。如果人類玩家連續失敗,大概率會轉換策略,或者打破之前的出拳規律,這時Multi-AI也可以隨之調整。所以,人類玩家最終大概率還是會輸。

由此可見,玩“石頭剪刀布”,人類確實玩不過AI,因為AI足夠聰明,它總能根據既往數據和當前對手的特點,找到人類玩家的漏洞,進而取勝。但是,你認為AI僅僅用于“石頭剪刀布”嗎?其實它的用處太多了,它可以是一個很厲害的循環制衡模型分析師,未來有望拓展到其他博弈場景,比如預測競爭對手的下一步舉動、規劃更有效的競選策略,或者制訂更有利的定價方案等。

猜你喜歡
勝率剪刀概率
概率與統計(1)
概率與統計(2)
主客場因素對大學生籃球聯賽戰績的影響研究
概率與統計解答題集錦
2014—2015年中國女子籃球職業聯賽單節得失分與比賽結果相關性分析
石頭剪刀布
貧民富翁
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合