哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI Dota2雖打敗人類玩家卻弱點頻現

電子工程師 ? 來源:fqj ? 2019-04-29 15:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在 4 月 14 日,OpenAI Five 代表人工智能拿下了與人類的競爭史上又一個里程碑:以 2 比 0 的絕對優(yōu)勢擊敗了 Dota 2 TI8 冠軍 OG 戰(zhàn)隊。其中甚至以碾壓之勢拿下第二盤,僅用 22 分鐘就“打卡下班”。比賽 4 天后,OpenAI 宣布將開放為期 3 天的 Arena 競技場模式,邀請所有 Dota 2 玩家挑戰(zhàn)OpenAI Five。

這場“人機大戰(zhàn)”的競技場于北京時間 4 月 22 日正式落幕。AI 在 Dota 2 競技場上獲得的最終成績?yōu)?7215 : 42,勝率高達 99.4%,足以看出 OG 的敗北并不是偶然事件。

相比較 8 個多月前 TI8 上的表現,我們能明顯看到 AI 的進步。比賽中有很多亮眼和極限操作,比如死血冰女果斷開大反殺兩人,家常便飯一樣的吹風/BKB 躲先手,走走停停的暗影護符卡視野等等,頂級人類玩家都未必能保證 100% 做到。

除了驚訝于 AI 的進步速度,Dota 社區(qū)有很多聲音認為 OG 只是“隨便玩玩,沒認真打”,而 OpenAI 隨后推出的競技場模式,就像是一封 AI 遞給人類的戰(zhàn)書,上書四個大字:You Can You Up。

筆者作為 Dota 老玩家,必然不能錯過這千載難逢的機會,但由于找不到足夠的人手對抗 AI,只能自己帶 4 個 AI 娛樂一下。在連輸兩局之后基本摸清了 AI 隊友的脾氣(從不聽話)和制裁 AI 的套路(隱身等于無敵),通過瘋狂帶線和毒瘤發(fā)育連贏三場“膀胱局”(指游戲時間特別長的對局),總算是勉強保住了 5000 分的尊嚴。

AI 稱霸,但人類大神達成十連勝

競技場有兩種模式,一種是五名人類玩家組隊對抗 AI,另一種是人類 + AI 的合作模式。

目前競技場已經關閉,OpenAI 還未放出詳細的比賽錄像和結果解析,不過根據排行榜數據和社區(qū)反饋,我們可以挖掘出很多關于 OpenAI Five 的特征。

值得注意的是,AI 的 99% 勝率看似恐怖,其實里面有很多“水分”,比如組隊娛樂的玩家。最有分析價值的還是人類獲勝的比賽。

排行榜顯示,在人類獲勝的 42 場比賽中,有一些來自于天梯大神隊伍,還有一些知名 Dota 2 主播的隊伍,比如 Twitch 平臺的 Waga,也有中國玩家熟悉的 OB 五人組和 Zard/天使焦/Fade/戰(zhàn)術大師 Rubick 等人。

在這些隊伍中,有一支隊長是“ainodehna”的隊伍一枝獨秀,取得了對抗 AI 的十連勝。相比之下,排名第二的隊伍僅有三連勝。

Steam 和 DotaBuff 的資料顯示,隊伍成員應該來自于俄羅斯或獨聯體地區(qū),其中的 ainodehna 和 junior 單排天梯分都在 7000 以上,獲得了冠絕一世獎章,歐服排名分別是 294 和 227。而且他們還有電競選手資料,很可能曾經加入過職業(yè)或準職業(yè)隊伍。

熱心網友教你識破 AI 套路

即便如此,想要獲得十連勝也絕對不是一件容易的事。哪怕是兩支水平相近的人類隊伍對戰(zhàn),也很少有這樣的連勝,他們所用的技巧因此引發(fā)了熱議。

由于這些比賽會在 Twitch 上直播,也會有人將人類勝利的視頻放到 YouTube 上,所以很快就有熱心網友在 Reddit 論壇上整理出了“如何打敗 AI”的帖子。

最開始的 1000 局比賽里,人類隊伍只贏了 3 局。但隨著時間的推移,OpenAI 的弱點逐漸暴露。就像所有游戲的 AI 一樣,如果你足夠強,擊敗 AI 總有套路可尋。

AI 的 5V5 團戰(zhàn)和遭遇戰(zhàn)都很強,但卻不擅長應對帶線和分推戰(zhàn)術,不擅長插眼和反眼,對信使的保護也很糟糕。它們在逆風局的時候大多窩在家里「打麻將」,不愛主動出擊,甚至還會頂著偷塔保護強拆兵營和基地,直到自己的高地建筑幾乎被拆光了才回家。

最致命的是,AI 非常不擅長應對隱身單位,隱身等于無敵。

圖 | 面對 AI,隱身等于無敵

于是就有了三輔助牽扯 AI 五人,兩大哥隱刀 BKB 拆家這樣的騷套路。還有網友表示,隱刺出了輝耀之后可以一直灼燒 AI 英雄,可是 AI 看不見隱刺,也不知道自己掉血的原因是輝耀隱刺在附近——人類玩家可以瞬間理解這種情況。

由此我們能夠看出,獲得了上千場勝利的 AI 似乎并未“學會”如何打 Dota,很多常識人類通過十幾局游戲就能快速掌握,但卻是AI學不明白的技巧。

AI 的強大是建立在靈活走位、反應迅速、無縫銜接技能和精準控制血量之上的“變態(tài)”微操作,它能夠依靠這些打贏遭遇戰(zhàn)和團戰(zhàn),但是面對人類故意設下的圈套或者隱身單位,它仍然缺乏合理的推理能力。

圖 | 人類強拆兵營,AI 卻只顧中路打架

換言之,在已經大規(guī)模減少復雜度的游戲中,AI 仍然難以透過復雜的表面看到本質,比如 AI 自己控制的英雄在不斷掉血,周圍卻沒有看到敵方英雄(表面),為什么會這樣(本質)?下一步該怎么辦?

打個比方,OpenAI Five 就像一個嚴重偏科的學生,有的科目能得 120 分,有的卻只能得 20 分。獲得連勝的隊伍正是揚長避短,利用明顯的“木桶效應”不斷制裁 AI,頗有幾分田忌賽馬的感覺。

OpenAI 自己也認為,大規(guī)模的競技場測試會回答一個重要的研究問題:OpenAI Five 在多大程度上可以被人類找到漏洞,進而被反復擊敗。

向“通用人工智能技術”進軍

我們可以將這一問題擴大到整個深度學習領域,甚至是通用人工智能技術(AGI)。

簡單來說,AGI 就是和人類智能水平相似的 AI 系統(tǒng),能夠進行感知、推理、學習、決策、行動和交流等任務,不必局限于某個應用領域,可以創(chuàng)造靈活的通用解決方案,能在很多領域替代人類。

按照 OpenAI 的愿景,今天陪人類玩游戲的 AI 系統(tǒng),明天很可能拓展到自動化和機器人領域,有望成為AGI 的雛形。

OpenAI 本指望通過競技場為 AI 積累通用經驗,但如今可能會面臨一個數據較少的嚴峻考驗:人類只贏了 42 場,這對于動輒分析數萬場訓練數據的 AI 來說,實在是九牛一毛,它真的可以從中學到什么嗎?

圖 | OpenAI 每天的訓練量相當于玩 180 年 Dota 游戲

假設 OpenAI Five 想要變成 AGI 的雛形,那么它的學習能力就應該媲美人類。

人類有什么樣的學習能力呢?從競技場的例子可以看出,AI 一開始連贏了 500 場,但一支人類頂尖隊伍在嘗試 2 次之后就獲得了勝利,之后還獲得了連勝。

隨著人類不斷挖掘 AI 的弱點,只用了 1 天就摸清了 AI 的套路,做到了可以穩(wěn)定擊敗 AI,最后取得十連勝(這支隊伍在競技場結束之后還在直播打 OpenAI,繼續(xù)保持了連勝記錄)。

也就是說,人類整體只用了幾百場游戲、頂尖個體甚至只用了 2 場游戲,就“學會了”如何反復擊敗訓練了 4.5 萬年的 AI,兩者的學習效率差距顯而易見。

當然,在比賽的過程中,OpenAI 自身是鎖定的,不會學習,也不會改變,給了人類找到套路的機會。但這并不能改變它需要的訓練數據遠超人類的事實。

圖 | 雙大哥隱刀 BKB 拆家

從大數據到小數據

現代機器學習領域最熱門的莫過于深度學習(AlphaGo)和強化學習(OpenAI Five)等人工神經網絡。當 AI 系統(tǒng)一次次在圍棋、電子游戲、圖像識別、自然語言處理等多個應用領域追上、甚至超越人類后,很多人都在使用這些技術探索可以應用于多個領域的 AGI 的可能性。

但是,這些技術都依賴于海量數據和計算資源,比如訓練 AI 識別醫(yī)療影像,進行中英翻譯或聽懂你說的話,均需要數十萬份訓練數據才能訓練出表現出色的模型。但它們也只能在特定場景下才能使用。因此,相對于被稱之為“強人工智能”的 AGI,這類 AI 系統(tǒng)普遍被稱為“弱”或“窄人工智能”(Narrow AI)。

如果想再更進一步,進軍 AGI,首先要攻克的就是在冷門應用場景下,訓練數據稀少的問題。

目前已有類似的努力,比如“僅需”數千個數據就能生效的生成模型(Generative Models)、數據需求進一步降低至數百的遷移學習(Transfer Learning),可以從零開始的單樣本學習(one-shot learning)和自我對戰(zhàn) (Self-Play),這都是近幾年的新興概念。

生成模型的基礎思想為“訓練算法來生成自己的訓練數據”,通過生成一個能夠抽取出基類數據的模型,根據少量的訓練數據,憑空“想”出大量的訓練數據。對于圖像來說,迄今最成功的生成模型是生成對抗網絡(GAN)。正如生成對抗網絡的發(fā)明人 Ian Goodfellow 所說的,生成模型給機器帶來了“想象力”。

但是,有些應用場景連訓練生成模型的數據都湊不夠。因此,由人類兒童學習方式啟發(fā)的遷移學習誕生了。

遷移學習是深度學習領域為了解決其海量數據需求而開發(fā)的一種手段。其基礎在于先用一個有著大量訓練數據的場景訓練模型。完成訓練后,該模型的特征將適用于所有跟這個應用場景相關或類似的具體場景。

換句話說,這個模型“學會”的特征可以被“遷移”到另外一個應用場景。比如用具有 1400 萬張照片的 ImageNet 去訓練一個圖像識別模型(通用特征),然后再訓練這個模型去具體地識別醫(yī)療成像中的腫瘤(具體應用)。

但遷移學習的基礎也限制了它的應用場景:如果一個任務的所有相關任務都缺少數據(比如打 Dota 2),就無法訓練遷移學習所需的“通用模型”(生成模型因此也不適用)。這也是將深度學習擴散到新的(少數據)應用領域時所面臨的最大挑戰(zhàn)。

計算機視覺任務領域,為了減少對訓練數據的依賴,研究人員正在努力研發(fā)單樣本學習。單樣本,指的是借助元學習(Meta Learning)技術的支持,只用展示一張圖片或者一段演示,就可以讓 AI 認識某個物品,學會某種技能,從而具備一種“觸類旁通”的能力。

而在其他從零開始的應用場景中,AI 可以根據規(guī)則在自我對戰(zhàn)中進行學習,這也正是 OpenAI Five 和 DeepMind 的 AlphaGo Zero 所使用的技術。自我對戰(zhàn)最大的優(yōu)勢在于可以“從零開始”,在大量的對戰(zhàn)中進行優(yōu)化,用大量的計算力和訓練時間來掌握一個技能。

無論哪種方法,我們都能看出類似的趨勢:減少數據需求。但是,從 OpenAI Five 競技場的表現來看,雖然現有的技術手段能夠有效地減少對數據的依賴,卻依然無法有效地提高模型訓練的速度。

所幸,提升學習速度也是當下機器學習領域的一個大熱門??梢灶A見的是,從 AI 到 AGI,將是一個漫長的發(fā)展歷程,而只借助少量數據就能迅速學習新技能的能力,將是發(fā)展過程中的最大難題之一。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 電子游戲
    +關注

    關注

    0

    文章

    39

    瀏覽量

    10259
  • AI
    AI
    +關注

    關注

    91

    文章

    40997

    瀏覽量

    302540

原文標題:AI Dota2雖完虐人類卻弱點頻現 | OpenAI Five親測報告

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    人工智能測試開發(fā)訓練營2

    正面臨前所未有的挑戰(zhàn)。許多團隊在引入AI測試時,往往陷入“工具崇拜”或“自動化迷信”的誤區(qū),導致投入巨大收效甚微。站在未來的視角回望,我們發(fā)現,AI測試的核心不在于工具的堆砌,而在于認知的重塑。(搜星 課
    發(fā)表于 04-11 16:42

    RZ/V2M:助力嵌入式設備的Vision AI高性能芯片

    M芯片作為一款專為實時人類和物體識別設計的Vision AI ASSP,具有諸多卓越特性,為嵌入式市場帶來了新的解決方案。今天,我們就來深入了解一下這款芯片。 文件下載: rzv2m.pdf 一、芯片
    的頭像 發(fā)表于 04-01 13:50 ?182次閱讀

    論馬斯克的預言:AI使人類邊緣化

    當地時間3月11日,在“Abundance Summit”科技峰會上,馬斯克談及AI進展時表示,AI已經進入自我改進階段,在超高量級AI面前,人類終將走向邊緣化。以下是對這一預言的相關
    發(fā)表于 03-14 05:27

    A2RL Drone Championship引領自主飛行領域AI創(chuàng)新加速前行

    阿布扎比自主賽車聯盟(A2RL)無人機錦標賽對自主飛行系統(tǒng)與人類飛行員的競技表現進行了決定性檢驗。Technology Innovation Institute旗下的TII Racing以創(chuàng)下最快
    的頭像 發(fā)表于 01-29 17:27 ?1620次閱讀

    AI賦能6G與衛(wèi)星通信:開啟智能天網新時代

    了30%,用戶平均體驗速度提高了25%。更重要的是,AI能夠根據用戶行為模式進行個性化優(yōu)化,例如為經常使用視頻會議的商務人士提供更高帶寬,為游戲玩家提供更低延遲的網絡服務。 增強信號處理:讓衛(wèi)星通信
    發(fā)表于 10-11 16:01

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    復制人類智能的AI---AGI。 走向AGI的五個層次發(fā)現階段: ①L1,聊天機器人:具備基礎的對話能力,能夠理解和回應簡單的文本輸入 ②L2,推理者:具備基本的邏輯推理能力,能夠分析復雜信息并進行推斷
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    AI被賦予了人的智能,科學家們希望在沒有人類的引導下,AI自主的提出科學假設,諾貝爾獎級別的假設哦。 AI驅動科學被認為是科學發(fā)現的第五個范式了,與實驗科學、理論科學、計算科學、數據驅
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    保持停滯的情況下,依照目前計算機的能耗效率,至少還需要30年的努力才接近其水準,見圖1所示。 圖1 大腦與計算機的能量效率對比 圖2 類腦芯片的前瞻性研究領域AI濕件 為此,一些想法超前的科學家
    發(fā)表于 09-06 19:12

    AI輸出“偏見”,人類能否信任它的“三觀”?

    ,大語言模型(LLM)正悄無聲息地傳播全球各地的刻板印象。從性別歧視、文化偏見,到語言不平等,AI正在把人類的“偏見行李”打包、升級,并以看似權威的方式輸出到世界
    的頭像 發(fā)表于 08-04 13:43 ?1435次閱讀
    <b class='flag-5'>AI</b>輸出“偏見”,<b class='flag-5'>人類</b>能否信任它的“三觀”?

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+自擬標題 注意事項 1、活動期間如有作弊、灌水等違反電子發(fā)燒友論壇規(guī)則的行為一經發(fā)現將立即取消獲獎資格 2、活動結束后獲獎名單將在論壇公示請活動參與者
    發(fā)表于 07-28 13:54

    ? 用于四 GSM / GPRS / EDGE – 八 FEM (1, 2/25, 3, 4, 5/18/19/26, 8, 20) WCDMA / HSPA / HSPA / LTE CDMA (頻段 BCO, 1, 6, 10, 14, 15) skyworksinc

    電子發(fā)燒友網為你提供()? 用于四 GSM / GPRS / EDGE – 八 FEM (1, 2/25, 3, 4, 5/18/19/26, 8, 20) WCDMA / H
    發(fā)表于 05-29 18:32
    ? 用于四<b class='flag-5'>頻</b> GSM / GPRS / EDGE – 八<b class='flag-5'>頻</b>多<b class='flag-5'>頻</b> FEM (1, <b class='flag-5'>2</b>/25, 3, 4, 5/18/19/26, 8, 20) WCDMA / HSPA / HSPA / LTE CDMA (頻段 BCO, 1, 6, 10, 14, 15) skyworksinc

    薄膜電弱點測試儀的常見問題及解決方案

    薄膜電弱點測試儀在薄膜生產、質檢等環(huán)節(jié)起著關鍵作用,用于檢測薄膜存在的針孔、裂紋等電弱點缺陷。然而在實際使用過程中,可能會遇到各種問題影響檢測效率與準確性。以下為薄膜電弱點測試儀常見問題及對應
    的頭像 發(fā)表于 05-29 13:26 ?841次閱讀
    薄膜電<b class='flag-5'>弱點</b>測試儀的常見問題及解決方案

    AI時代:不可替代的“人類+”職業(yè)技能

    當生成式人工智能能夠撰寫報告、編寫代碼甚至設計產品時,一個根本性的焦慮開始蔓延:人類工作者是否正在被算法取代?這個問題的答案或許比簡單的“是”或“否”更為復雜——AI確實在重塑職業(yè)版圖,但真正的挑戰(zhàn)
    的頭像 發(fā)表于 05-20 16:13 ?868次閱讀

    “有我們在,請放心”——星通時 SCTF 助力晶振國產替代

    4月3日,美國總統(tǒng)特朗普發(fā)布了對等關稅政策,貿易戰(zhàn)的血雨腥風沉沉浮浮地吹了已有一月,仍在持續(xù)吞噬著人類的商業(yè)文明和人的良知。有我們在,請放心基于當前特朗普政府關稅政策的風險,星通時能夠做到
    的頭像 發(fā)表于 04-29 10:08 ?1163次閱讀
    “有我們在,請放心”——星通時<b class='flag-5'>頻</b> SCTF 助力晶振國產替代
    温泉县| 塔河县| 九寨沟县| 博白县| 驻马店市| 瑞丽市| 无极县| 牟定县| 茶陵县| 安岳县| 霍城县| 元谋县| 田东县| 汪清县| 三江| 东兰县| 鄂伦春自治旗| 观塘区| 延吉市| 府谷县| 政和县| 呼图壁县| 丰城市| 呼和浩特市| 广昌县| 黄浦区| 永德县| 海城市| 安顺市| 温州市| 北流市| 博客| 达尔| 河东区| 潮安县| 长子县| 普兰县| 深水埗区| 嵊泗县| 娄底市| 禄丰县|