人工智能時代下,猜拳還能公平嗎?

文/陳根

如果說,有一種決策的方法能跨越文化、種族和地域的限制,那么除了抽簽這種純靠運氣的方式,恐怕只剩下猜拳了。

猜拳被長久地使用在生活中不需要太多思考的決策里,一般認為,玩家獲勝的概率應該是一樣的,即恒定的30%左右,從長遠來看,這使任意玩家同樣有可能贏、平或輸。這就是所謂的混合策略納什均衡,在這種均衡中,每個參與者在每一輪中以相等的概率選擇三個行動。

但事實可能并非如此,來自浙江大學的研究團隊的研究發(fā)現(xiàn),真正的玩家的策略看起來是隨機的,但實際上是由可預測的模式組成的,狡猾的對手可以利用這些模式來獲得重要的優(yōu)勢。

具體來說,研究團隊開發(fā)了一個基于基于n-階馬爾可夫鏈的人工智能模型——Multi-AI ,這意味著Multi-AI 擁有記憶性,能夠向前追溯最多 n 個歷史狀態(tài)并加以利用。研究人員將單個模型結合起來,應對人類玩家的不同性格和策略。

如果人類玩家連續(xù)勝利,就會促使 Multi-AI 轉向選擇其他人工智能模型的更優(yōu)解。如果人類玩家連續(xù)失敗,大概率會轉換策略,或者打破之前的出拳規(guī)律,這時Multi-AI 也可以隨之調整。

這意味著一種不同的博弈策略。即Multi-AI 模型更強調針對不同玩家之間的個性差異、出拳策略,來及時的進行調控,選取當下最適宜的博弈策略。

最終實驗結果發(fā)現(xiàn),在和52名人類玩家分別大戰(zhàn)300回合之后,人工智能擊敗了95%的玩家。由于比賽規(guī)則是贏+2分,平+1分,輸不得分,且參與者均知道獲勝會獲得金錢獎勵,總分越高,贏的錢越多,因此玩家故意放水或者隨便亂選的可能性極小。

即便如此,人工智能仍然大勝人類。在最懸殊的一場較量中,人工智能獲得了198次勝利,55次平手,僅輸了47次,勝率超過人類對手4倍。

當然,這項關于猜拳的最新研究,成果不僅僅是一個很厲害的猜拳人工智能,還是一個很厲害的循環(huán)制衡模型分析師,這意味著人類的競爭行為確實有規(guī)律可循,而通過使用適當?shù)暮唵文P途湍芾眠@些規(guī)律。研究人員認為,該人工智能模型未來有望拓展到其他博弈場景,比如預測競爭對手的下一步舉動,規(guī)劃更有效的競選策略,或者制定更有利的定價方案等等。

(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )

贊助商
2020-09-04
人工智能時代下,猜拳還能公平嗎?
文/陳根如果說,有一種決策的方法能跨越文化、種族和地域的限制,那么除了抽簽這種純靠運氣的方式,恐怕只剩下猜拳了。

長按掃碼 閱讀全文