原標題:微軟麻將ai超越人類后,研究小組推出教材提高人類卡片技術來源:網易科學技術
(原標題:微軟麻將ai超過人類后,研究小組說,其目的是拿出教材來提高人卡技術)。
情報記者王心馨沸騰了
人類今后可能想提高自己的麻將技能,必須以人工智能為師。
微軟亞洲研究院開發的麻將ai系統suphx在國際知名麻將平臺“天鳳”上升了10檔,擁有超過99.99%的人后,研究小組接受了澎湃情報( thepaper )的采訪,日本出版社 如果你對麻將感興趣,你可以學習如何在這本書里打麻將。
4月9日,微軟亞洲研究院suphx研究開發小組通過在線直播,詳細介紹了suphx的技術細節,該論文最近在arxiv平臺上發表。 直播結束后,微軟亞洲研究首席研究員秦濤、微軟亞洲研究院高級研究工程師李俊杰在接受彭湃的信息采訪時表示,團隊目前正在與天鳳平臺進行協商,為提高人類卡片技術提供服務 例如,通過輸入身體的現在的卡面,suphx告訴那個人應該打哪個卡,以及為什么應該打那個卡。
值得一提的是,據兩位研究者說,有日本出版社的聯系,希望suphx發行的卡片出書。 “喜歡麻將的人稱suphx為麻將教科書、suphx老師,因此對麻將感興趣的同學們可以在這本書里學習如何打牌。 ”。
suphx如何提高顯卡技術?
去年8月,微軟亞洲研究院在世界人工智能大會上正式宣布,開發的麻將ai系統suphx成為第一個在國際知名的職業麻將平臺“天鳳”上升10級的ai系統。
過去半年多來,研究小組重新調整了suphx。 具體來說,一是重新優化整個系統體系結構,使其更快更好。 另一個是對“先知教練”這樣的算法也進行了改進。 從博弈論的角度來看,麻將是大多數人的非完美新聞游戲。 麻將一共是136張卡,每人只能看到很少的卡片。 包括自己的13張手牌和所有人打的卡,越來越多的卡看不見了。 包括其他三個玩家的手牌和墻牌。 面對這么多隱藏的未知消息,麻將玩家不容易只根據自己的手牌作出好的決定。
但是,通過先知教練,suphx將(1)玩家自己的私人手、(2)所有玩家的公開卡、(3)其他公共新聞、(4)其他三個玩家的私人手、(5)墻卡等所有消息 (1)只有(2)和(3)可以得到正常的玩家,但(4)和(5)只有“先知”可以得到追加的完美消息。
在suphx中,suphx研究開發小組首先采用包括完美新聞在內的所有特征強化學習訓練“先知”,在這一步中控制“先知”的學習進度,不要太強大。 然后,通過在完美的特征中追加mask,使“先知”最終轉移到正常的ai。 其次,繼續訓練正常的ai,進行一定數量的反復,用衰減學習率和拒絕采樣的妙手調整訓練過程,不斷精進ai的技術。
愿alphago最初以人為師,升級后,自己開始“左右互博”,不斷提高。 秦濤在采訪中,suphx也完全不使用人的數據嘗試過訓練,可以直接使用self-play,只是訓練速度有點慢,這是背后的算法做了一點新的改變,讓計算機學習得更快。
將來可以用于股票主板
suphx打麻將只是第一步。 兩位研究者表示,團隊在金融領域和物流領域進行了一些嘗試,使suphx技術落地制作了實際的應用場景。
金融業如果知道明天的股票行情,今天的投資一定會順利的。 這在某種程度上是完美的消息。 例如,如果今天a股關閉,我們就知道今天所有的股票新聞。 回顧昨天,假設你在做昨天的決定時知道了今天的股票新聞。 那對股票操縱來說是完美的消息。 研究人員認為在這種情況下可以利用完美的消息更好地訓練模型。 實際使用就像麻將一樣,通過完美的消息,我們可以得到非常強大的老師——teacher model。 這樣也可以很好地學習學生模型student model。
在機器翻譯行業,完美的消息也很有用。 例如在機器翻譯中,如果知道一句上下文,那可能會成為更好的翻譯,也就是完美的消息。 但是,實際上并不是所有的語言都知道它的上下文,如果在訓練中能得到完美的消息,就能使翻譯更好。
那些還不夠。
從這次發表的論文來看,suphx的技術表現是完美的。 但是,在兩位研究者看來,未來的suphx還有進步的空之間。
“我們現在也經常使用高手的數據訓練模型,達到強化學習,但麻將的平臺和規則不同,并非所有的平臺都能獲得人類的數據。 在這種情況下,不需要別人的數據就可以直接從0開始,這是我們在做的。 ”秦濤說。
與圍棋、象棋、dota游戲相比,麻將的隨機因素很多,對模型的訓練和測試有很大的影響。 研究小組表示,他們的模型在測試中基本上跑了一百萬游戲,以確保知道誰更厲害。 這與圍棋不同,圍棋五次三勝,與麻將不同。 這種情況下,如何更迅速地完成游戲,得到可靠的結果,也是團隊研究的問題。
最后,團隊認為suphx可以對不同的對手采取一點適應的戰略。
全天候滾動播放最新的財經信息和視頻,越來越多的粉絲福利掃描二維碼備受關注( finance )。
標題:【熱門】微軟麻將AI超越人類后 研究團隊要出教材提升人類牌技
地址:http://m.swled.com.cn/gphq/2816.html