哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

XGBoost號稱“比賽奪冠的必備大殺器”,橫掃機器學(xué)習(xí)競賽罕逢敵手

DPVg_AI_era ? 來源:lq ? 2019-04-30 09:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

XGBoost號稱“比賽奪冠的必備大殺器”,橫掃機器學(xué)習(xí)競賽罕逢敵手,堪稱機器學(xué)習(xí)算法中的新女王!

在涉及非結(jié)構(gòu)化數(shù)據(jù)(圖像、文本等)的預(yù)測問題中,人工神經(jīng)網(wǎng)絡(luò)顯著優(yōu)于所有其他算法或框架。但當(dāng)涉及到中小型結(jié)構(gòu)/表格數(shù)據(jù)時,基于決策樹的算法現(xiàn)在被認(rèn)為是最佳方法。而基于決策樹算法中最驚艷的,非XGBoost莫屬了。

打過Kaggle、天池、DataCastle、Kesci等國內(nèi)外數(shù)據(jù)競賽平臺之后,一定對XGBoost的威力印象深刻。XGBoost號稱“比賽奪冠的必備大殺器”,橫掃機器學(xué)習(xí)競賽罕逢敵手。最近甚至有一位大數(shù)據(jù)/機器學(xué)習(xí)主管被XGBoost在項目中的表現(xiàn)驚艷到,盛贊其為“機器學(xué)習(xí)算法中的新女王”!

XGBoost最初由陳天奇開發(fā)。陳天奇是華盛頓大學(xué)計算機系博士生,研究方向為大規(guī)模機器學(xué)習(xí)。他曾獲得KDD CUP 2012 Track 1第一名,并開發(fā)了SVDFeature,XGBoost,cxxnet等著名機器學(xué)習(xí)工具,是Distributed (Deep) Machine Learning Common的發(fā)起人之一。

XGBoost實現(xiàn)了高效、跨平臺、分布式gradient boosting (GBDT, GBRT or GBM) 算法的一個庫,可以下載安裝并應(yīng)用于C++,Python,R,Julia,Java,Scala,Hadoop等。目前Github上超過15700星、6500個fork。

項目主頁:

https://XGBoost.ai/

XGBoost是什么

XGBoost全稱:eXtreme Gradient Boosting,是一種基于決策樹的集成機器學(xué)習(xí)算法,使用梯度上升框架,適用于分類和回歸問題。優(yōu)點是速度快、效果好、能處理大規(guī)模數(shù)據(jù)、支持多種語言、支持自定義損失函數(shù)等,不足之處是因為僅僅推出了不足5年時間,需要進一步的實踐檢驗。

XGBoost選用了CART樹,數(shù)學(xué)公式表達XGBoost模型如下:

K是樹的數(shù)量,F(xiàn)表示所有可能的CART樹,f表示一棵具體的CART樹。這個模型由K棵CART樹組成。

模型的目標(biāo)函數(shù),如下所示:

XGBoost具有以下幾個特點:

靈活性:支持回歸、分類、排名和用戶定義函數(shù)

跨平臺:適用于Windows、Linux、macOS,以及多個云平臺

多語言:支持C++, Python, R, Java, Scala, Julia等

效果好:贏得許多數(shù)據(jù)科學(xué)和機器學(xué)習(xí)挑戰(zhàn)。用于多家公司的生產(chǎn)

云端分布式:支持多臺計算機上的分布式訓(xùn)練,包括AWS、GCE、Azure和Yarn集群??梢耘cFlink、Spark和其他云數(shù)據(jù)流系統(tǒng)集成

下圖顯示了基于樹的算法的發(fā)展歷程:

決策樹:由一個決策圖和可能的結(jié)果(包括資源成本和風(fēng)險)組成, 用來創(chuàng)建到達目標(biāo)的規(guī)劃。

Bagging:是一種集合元算法,通過多數(shù)投票機制將來自多決策樹的預(yù)測結(jié)合起來,也就是將弱分離器 f_i(x) 組合起來形成強分類器 F(x) 的一種方法

隨機森林:基于Bagging算法。隨機選擇一個包含多種特性的子集來構(gòu)建一個森林,或者決策樹的集合

Boosting:通過最小化先前模型的誤差,同時增加高性能模型的影響,順序構(gòu)建模型

梯度上升:對于似然函數(shù),要求最大值,叫做梯度上升

XGBoost:極端梯度上升,XGBoost是一個優(yōu)化的分布式梯度上升庫,旨在實現(xiàn)高效,靈活和跨平臺

為什么XGBoost能橫掃機器學(xué)習(xí)競賽平臺?

下圖是XGBoost與其它gradient boosting和bagged decision trees實現(xiàn)的效果比較,可以看出它比R, Python,Spark,H2O的基準(zhǔn)配置都快。

XGBoost和Gradient Boosting Machines(GBMs)都是集合樹方法,使用梯度下降架構(gòu)來提升弱學(xué)習(xí)者(通常是CART)。而XGBoost通過系統(tǒng)優(yōu)化和算法增強改進了基礎(chǔ)GBM框架,在系統(tǒng)優(yōu)化和機器學(xué)習(xí)原理方面都進行了深入的拓展。

系統(tǒng)優(yōu)化:

并行計算:

由于用于構(gòu)建base learners的循環(huán)的可互換性,XGBoost可以使用并行計算實現(xiàn)來處理順序樹構(gòu)建過程。

外部循環(huán)枚舉樹的葉節(jié)點,第二個內(nèi)部循環(huán)來計算特征,這個對算力要求更高一些。這種循環(huán)嵌套限制了并行化,因為只要內(nèi)部循環(huán)沒有完成,外部循環(huán)就無法啟動。

因此,為了改善運行時,就可以讓兩個循環(huán)在內(nèi)部交換循環(huán)的順序。此開關(guān)通過抵消計算中的所有并行化開銷來提高算法性能。

Tree Pruning:

GBM框架內(nèi)樹分裂的停止標(biāo)準(zhǔn)本質(zhì)上是貪婪的,取決于分裂點的負(fù)損失標(biāo)準(zhǔn)。XGBoost首先使用'max_depth'參數(shù)而不是標(biāo)準(zhǔn),然后開始向后修剪樹。這種“深度優(yōu)先”方法顯著的提高了計算性能。

硬件優(yōu)化:

該算法旨在有效利用硬件資源。這是通過在每個線程中分配內(nèi)部緩沖區(qū)來存儲梯度統(tǒng)計信息來實現(xiàn)緩存感知來實現(xiàn)的。諸如“核外”計算等進一步增強功能可優(yōu)化可用磁盤空間,同時處理不適合內(nèi)存的大數(shù)據(jù)幀。

算法增強:

正則化:

它通過LASSO(L1)和Ridge(L2)正則化來懲罰更復(fù)雜的模型,以防止過擬合。

稀疏意識:

XGBoost根據(jù)訓(xùn)練損失自動“學(xué)習(xí)”最佳缺失值并更有效地處理數(shù)據(jù)中不同類型的稀疏模式。

加權(quán)分位數(shù)草圖:

XGBoost采用分布式加權(quán)分位數(shù)草圖算法,有效地找到加權(quán)數(shù)據(jù)集中的最優(yōu)分裂點。

交叉驗證:

該算法每次迭代時都帶有內(nèi)置的交叉驗證方法,無需顯式編程此搜索,并可以指定單次運行所需的增強迭代的確切數(shù)量。

為了測試XGBoost到底有多快,可以通過Scikit-learn的'Make_Classification'數(shù)據(jù)包,創(chuàng)建一個包含20個特征(2個信息和2個冗余)的100萬個數(shù)據(jù)點的隨機樣本。

下圖為邏輯回歸,隨機森林,標(biāo)準(zhǔn)梯度提升和XGBoost效率對比:

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:陳天奇做的XGBoost為什么能橫掃機器學(xué)習(xí)競賽平臺?

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    太燃了!人形機器人1500米比賽,這家奪冠!更有機器人全程自主奔跑

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)2025年8月14日晚,北京國家速滑館“冰絲帶”迎來了全球首個以人形機器人為參賽主體的綜合性體育盛會——世界人形機器人運動會。此次運動會由中央廣播電視總臺、北京市
    的頭像 發(fā)表于 08-17 06:21 ?9902次閱讀
    太燃了!人形<b class='flag-5'>機器</b>人1500米<b class='flag-5'>比賽</b>,這家<b class='flag-5'>奪冠</b>!更有<b class='flag-5'>機器</b>人全程自主奔跑

    榮耀“閃電”機器奪冠續(xù)航翻倍的秘密?格瑞普深度解讀人形機器人電池定制

    。當(dāng)榮耀齊天大圣隊的自主導(dǎo)航機器人“閃電”以50分26秒(凈用時)率先沖線,所有人都意識到:人形機器人的奔跑能力,已經(jīng)超出了多數(shù)人的預(yù)期。一、榮耀“閃電”憑什么奪冠
    的頭像 發(fā)表于 04-20 12:03 ?271次閱讀
    榮耀“閃電”<b class='flag-5'>機器</b>人<b class='flag-5'>奪冠</b>續(xù)航翻倍的秘密?格瑞普深度解讀人形<b class='flag-5'>機器</b>人電池定制

    榮耀“閃電”奪冠!2026年北京亦莊人形機器人大賽,三大關(guān)鍵技術(shù)升級

    4月19日,2026年亦莊半程馬拉松暨人形機器人馬拉松開跑,參加此次比賽一共超百支人形機器人賽隊,同時1.2萬人共同參賽。榮耀齊天大圣隊的自主導(dǎo)航機器人“閃電”以50分26秒(凈用時)
    的頭像 發(fā)表于 04-20 11:16 ?6506次閱讀
    榮耀“閃電”<b class='flag-5'>奪冠</b>!2026年北京亦莊人形<b class='flag-5'>機器</b>人大賽,三大關(guān)鍵技術(shù)升級

    人工智能與機器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機器學(xué)習(xí)問世以來,多個在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機器學(xué)習(xí)
    的頭像 發(fā)表于 02-04 14:44 ?659次閱讀

    第21屆全國大學(xué)生智能汽車競賽龍芯“走馬觀碑”組首場直播培訓(xùn)

    第二十一屆全國大學(xué)生智能汽車競賽已正式開啟。在本屆比賽中,“走馬觀碑”組將基于龍芯處理構(gòu)建核心控制平臺,進一步推動國產(chǎn)自主技術(shù)在教育與競賽領(lǐng)域的深度應(yīng)用。值得關(guān)注的是,本屆賽事在硬件
    的頭像 發(fā)表于 01-30 09:51 ?1074次閱讀

    機器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?342次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個常見錯誤與局限性

    廣和通斬獲具身智能家務(wù)機器人黑客松競賽二等獎

    近日,廣和通受邀參加由 Hugging Face、NVIDIA 與 Seeed Studio 聯(lián)合舉辦的“具身智能家務(wù)機器人黑客松”競賽。在本次前沿賽事中,廣和通團隊成功開發(fā)、部署并演示了“雙臂協(xié)作家務(wù)機器人系統(tǒng)”,憑借其創(chuàng)新的
    的頭像 發(fā)表于 11-08 14:51 ?1809次閱讀

    EtherCAT?技術(shù)前瞻:人形機器人通信的新選擇!

    近年來,隨著人形機器人逐漸從實驗室走向?qū)嵱没?,其相關(guān)新聞頻繁占據(jù)技術(shù)頭條。從高校比賽、企業(yè)研發(fā)推進到亮相春晚舞臺,從仿生步態(tài)研究、智能交互開發(fā)到參與近期運動競賽(如馬拉松、RoboCup等),各種
    的頭像 發(fā)表于 10-22 17:36 ?1751次閱讀
    EtherCAT?技術(shù)前瞻:人形<b class='flag-5'>機器</b>人通信的新選擇!

    TDK傳感技術(shù)助力實現(xiàn)標(biāo)槍比賽數(shù)據(jù)的可視化

    近日,TDK株式會社(東京證券交易所代碼:6762) 宣布,通過與世界田徑聯(lián)合會于2025年6月宣布的技術(shù)合作,成功實現(xiàn)了標(biāo)槍比賽數(shù)據(jù)的可視化。通過應(yīng)用TDK的優(yōu)勢傳感技術(shù),將此前無法觀察到的信息可視化,旨在進一步提升比賽魅力
    的頭像 發(fā)表于 09-26 09:10 ?1331次閱讀

    機器人競技幕后:磁傳感芯片激活 “精準(zhǔn)感知力”

    粉塵、高溫等極端環(huán)境下信號衰減的難題。在 “精密裝配” 比賽中,參賽隊借助升級后的磁編碼,將機器人手指夾持精度從 0.2mm 提升至 0.05mm,成功完成 0.3mm 間隙的零件對接,助力團隊
    發(fā)表于 08-26 10:02

    第六屆TE Connectivity AI Cup全球競賽圓滿收官

    近日,在全球行業(yè)技術(shù)領(lǐng)先企業(yè)TE Connectivity(以下簡稱“TE”)主辦的第六屆TE AI Cup全球競賽中,中國西南財經(jīng)大學(xué)團隊與華南理工大學(xué)團隊?wèi){借出色表現(xiàn)雙雙奪冠。作為聚焦培養(yǎng)高校
    的頭像 發(fā)表于 08-25 14:13 ?0次閱讀

    FPGA在機器學(xué)習(xí)中的具體應(yīng)用

    隨著機器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?3075次閱讀

    超燃!人形機器人格斗賽,這隊奪冠!

    電子發(fā)燒友網(wǎng)綜合報道 5月25日晚,《CMG世界機器人大賽·系列賽》機甲格斗擂臺賽在杭州舉行,這是全球首個以人形機器人為參賽主體的格斗競技賽事。 ? 這場比賽主要由表演賽和競技賽兩部分組成,雖然是四
    的頭像 發(fā)表于 05-27 00:07 ?3961次閱讀
    超燃!人形<b class='flag-5'>機器</b>人格斗賽,這隊<b class='flag-5'>奪冠</b>!

    全球首個人形機器人半馬開跑,“天工”奪冠彰顯科技新高度

    4月19日上午,北京亦莊迎來了一場別開生面的賽事——全球首個人形機器人半程馬拉松比賽。這場匯聚科技與激情的盛會,吸引了來自北京、上海、浙江等多地的20支機器人隊伍踴躍參賽,共同書寫機器
    的頭像 發(fā)表于 05-19 13:26 ?904次閱讀
    全球首個人形<b class='flag-5'>機器</b>人半馬開跑,“天工”<b class='flag-5'>奪冠</b>彰顯科技新高度

    從人形機器人馬拉松開跑看機器人“核心大小腦”的方案優(yōu)勢

    2025年4月19日,北京亦莊上演了一場備受關(guān)注的人形機器人半程馬拉松比賽,20多臺機器人與上萬名人類選手同跑,最終“天工Ultra”以2小時40分42秒的成績奪冠。從實驗室到完全開放
    的頭像 發(fā)表于 04-28 17:31 ?872次閱讀
    霍州市| 同德县| 永和县| 海兴县| 昌平区| 天柱县| 新余市| 博客| 富源县| 邹平县| 阿鲁科尔沁旗| 霍山县| 隆化县| 西林县| 邢台县| 邵东县| 葵青区| 政和县| 安宁市| 蛟河市| 澄迈县| 峨边| 钟山县| 积石山| 汝阳县| 文山县| 晋中市| 商水县| 尼玛县| 乐亭县| 霍邱县| 三门峡市| 阜康市| 馆陶县| 泰来县| 吉水县| 潮安县| 大关县| 精河县| 高碑店市| 彰武县|