哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

GBDT是如何用于分類的

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2020-12-26 10:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

? 因為用樹模型太習以為常了,以至于看到這個標題很容易覺得這很顯然。但越簡單的東西越容易出現(xiàn)知識盲區(qū),仔細想一下好像確實有點疑問:GBDT 用的是回歸樹,是如何做的分類呢? - 作者:1直在路上1 -https://www.cnblogs.com/always-fight/p/9400346.html 編輯:阿澤的學習筆記 ?

一 簡介

GBDT 在傳統(tǒng)機器學習算法里面是對真實分布擬合的最好的幾種算法之一,在前幾年深度學習還沒有大行其道之前,GBDT 在各種競賽是大放異彩。原因大概有幾個

效果確實挺不錯;

既可以用于分類也可以用于回歸;

可以篩選特征。

這三點實在是太吸引人了,導致在面試的時候大家也非常喜歡問這個算法。

GBDT 是通過采用加法模型(即基函數(shù)的線性組合),以及不斷減小訓練過程產(chǎn)生的殘差來達到將數(shù)據(jù)分類或者回歸的算法。

GBDT 通過多輪迭代,每輪迭代產(chǎn)生一個弱分類器,每個分類器在上一輪分類器的殘差基礎上進行訓練。對弱分類器的要求一般是足夠簡單,并且是低方差和高偏差的。因為訓練的過程是通過降低偏差來不斷提高最終分類器的精度。

二 GBDT如何用于分類的

第一步:「訓練的時候,是針對樣本 X 每個可能的類都訓練一個分類回歸樹」。如目前的訓練集共有三類,即 K = 3,樣本 x 屬于第二類,那么針對樣本x的分類結(jié)果,我們可以用一個三維向量 [0,1,0] 來表示,0 表示不屬于該類,1 表示屬于該類,由于樣本已經(jīng)屬于第二類了,所以第二類對應的向量維度為 1,其他位置為 0。

針對樣本有三類的情況,我們實質(zhì)上是在每輪的訓練的時候是同時訓練三顆樹。第一顆樹針對樣本 x 的第一類,輸入是 ,第二顆樹針對樣本x的第二類,輸入是 ,第三顆樹針對樣本x的第三類,輸入是 。

在對樣本 x 訓練后產(chǎn)生三顆樹,對 x 類別的預測值分別是 ,那么在此類訓練中,樣本 x 屬于第一類,第二類,第三類的概率分別是:

然后可以求出針對第一類,第二類,第三類的殘差分別是:

然后開始第二輪訓練,針對第一類輸入為 ,針對第二類輸入為 ,針對第三類輸入為 ,繼續(xù)訓練出三顆樹。一直迭代M輪,每輪構建三棵樹當訓練完畢以后,新來一個樣本 ,我們需要預測該樣本的類別的時候,便產(chǎn)生三個值 ,則樣本屬于某個類別 c 的概率為:

三 GBDT多分類舉例說明

下面以 Iris 數(shù)據(jù)集的六個數(shù)據(jù)為例來展示 GBDT 多分類的過程

d248a150-4692-11eb-8b86-12bb97331649.png

具體應用到 gbdt 多分類算法。我們用一個三維向量來標志樣本的 label,[1,0,0] 表示樣本屬于山鳶尾,[0,1,0] 表示樣本屬于雜色鳶尾,[0,0,1] 表示屬于維吉尼亞鳶尾。

gbdt 的多分類是針對每個類都獨立訓練一個 CART Tree。所以這里,我們將針對山鳶尾類別訓練一個 CART Tree 1。雜色鳶尾訓練一個 CART Tree 2 。維吉尼亞鳶尾訓練一個CART Tree 3,這三個樹相互獨立。

我們以樣本 1 為例:

針對 CART Tree1 的訓練樣本是 [5.1,3.5,1.4,0.2],label 是 1,模型輸入為 [5.1, 3.5, 1.4, 0.2, 1]

針對 CART Tree2 的訓練樣本是 [5.1,3.5,1.4,0.2],label 是 0,模型輸入為 [5.1, 3.5, 1.4, 0.2, 0]

針對 CART Tree3 的訓練樣本是 [5.1,3.5,1.4,0.2],label 是 0,模型輸入為[5.1, 3.5, 1.4, 0.2, 0]

下面我們來看 CART Tree1 是如何生成的,其他樹 CART Tree2 , CART Tree 3 的生成方式是一樣的。CART Tree 的生成過程是從這四個特征中找一個特征做為 CART Tree1 的節(jié)點。

比如花萼長度做為節(jié)點。6 個樣本當中花萼長度大于等于 5.1 cm 的就是 A 類,小于 5.1 cm 的是 B 類。生成的過程其實非常簡單,問題

是哪個特征最合適?

是這個特征的什么特征值作為切分點?

即使我們已經(jīng)確定了花萼長度做為節(jié)點?;ㄝ嚅L度本身也有很多值。在這里我們的方式是遍歷所有的可能性,找到一個最好的特征和它對應的最優(yōu)特征值可以讓當前式子的值最小:

我們以第一個特征的第一個特征值為例。R1 為所有樣本中花萼長度小于 5.1cm 的樣本集合,R2 為所有樣本中花萼長度大于等于 5.1cm 的樣本集合,所以 。

d2763b74-4692-11eb-8b86-12bb97331649.png

為 R1 所有樣本label的均值:, 為 R2 所有樣本 label 的均值:

下面計算損失函數(shù)的值,采用平方誤差,分別計算 R1 和 R2 的誤差平方和,樣本 2 屬于 R1 的誤差:,樣本 1,3,4,5,6 屬于 R2 的誤差和:

接著我們計算第一個特征的第二個特征值,即 R1 為所有樣本中花萼長度小于 4.9 cm 的樣本集合,R2 為所有樣本當中花萼長度大于等于 4.9 cm 的樣本集合,, 為 R1 所有樣本 label 的均值:0, 為 R2 所有樣本 label 的均值:

d2b2c436-4692-11eb-8b86-12bb97331649.png

計算所有樣本的損失值,樣本 1 和 2 屬于 R2,損失值為:,樣本 3,4,5,6 也屬于 R2,損失值為:,兩組損失值和為 2.222,大于特征一的第一個特征值的損失值,所以我們不取這個特征的特征值。

「繼續(xù),這里有四個特征,每個特征有六個特征值,所有需要 6*4=24 個損失值的計算,我們選取值最小的分量的分界點作為最佳劃分點,這里我們就不一一計算了,直接給出最小的特征花萼長度,特征值為 5.1 cm。這個時候損失函數(shù)最小為 0.8。于是我們的預測函數(shù)此時也可以得到:」

「此例子中,訓練完以后的最終式子為:」

由這個式子,我們得到對樣本屬于類別 1 的預測值:,同理我們可以得到對樣本屬于類別 2,3 的預測值 ,樣本屬于類別 1 的概率

責任編輯:xj

原文標題:GBDT 如何用于分類問題

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4800

    瀏覽量

    98515
  • 機器學習
    +關注

    關注

    67

    文章

    8561

    瀏覽量

    137208
  • GBDT
    +關注

    關注

    0

    文章

    13

    瀏覽量

    4220

原文標題:GBDT 如何用于分類問題

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    調(diào)用1688開放平臺商品分類API獲取分類數(shù)據(jù)

    如何調(diào)用1688的“獲取商品分類樹”API。 一、 接口簡介 API名稱: alibaba.category.get 功能描述: 此接口用于獲取1688平臺的商品類目信息。它可以返回一級類目列表,或者根據(jù)傳入的父類目ID,查詢其下的子類目列表。 適用場景: 構建商品發(fā)布系
    的頭像 發(fā)表于 02-02 16:19 ?498次閱讀
    調(diào)用1688開放平臺商品<b class='flag-5'>分類</b>API獲取<b class='flag-5'>分類</b>數(shù)據(jù)

    何用軟件實現(xiàn)系統(tǒng)的復位?

    看門狗的工作過程是怎樣的? 如何用軟件實現(xiàn)系統(tǒng)的復位?
    發(fā)表于 01-08 06:15

    請問如何用C語言列舉當前所有網(wǎng)口?

    何用C語言列舉當前所有網(wǎng)口?
    發(fā)表于 11-25 07:23

    發(fā)布元服務配置應用分類、標簽和資質(zhì)信息

    分類標簽和資質(zhì)管理”菜單選擇元服務歸屬的類別和標簽,同時將所需的資質(zhì)文件提交給華為運營人員審核。資質(zhì)文件審核通過后,您選擇的標簽才能生效,之后才可選擇生效標簽進行配置。關于資質(zhì)文件的具體要求,請
    發(fā)表于 10-29 16:47

    何用FPGA實現(xiàn)4K視頻的輸入輸出與處理

    在游戲、影視和顯示領域,4K 已經(jīng)成為標配。而今天,我們就來聊聊——如何用 FPGA 實現(xiàn) 4K 視頻的輸入輸出與處理。
    的頭像 發(fā)表于 10-15 10:47 ?2384次閱讀
    如<b class='flag-5'>何用</b>FPGA實現(xiàn)4K視頻的輸入輸出與處理

    RFID在垃圾分類中的核心優(yōu)勢

    RFID在垃圾分類中的核心優(yōu)勢精準溯源每個居民或單位的垃圾桶配備唯一編碼的RFID標簽,系統(tǒng)可記錄每次投放的時間、地點和責任人,實現(xiàn)垃圾來源可追溯。自動識別分類在智能垃圾箱上安裝RFID讀寫器,當
    的頭像 發(fā)表于 09-23 11:08 ?675次閱讀
    RFID在垃圾<b class='flag-5'>分類</b>中的核心優(yōu)勢

    傳感器大全分類

    傳感器大全分類
    發(fā)表于 09-04 16:56 ?8次下載

    關于NanoEdge AI用于n-Class的問題求解

    我想請教一下關于NanoEdge AI用于n-Class的問題。我使用NanoEdge AI的n-Class模式,訓練好模型,設計了3個分類,使用PC端的模擬工具測試過,模型可以正常對數(shù)據(jù)進行分類
    發(fā)表于 08-11 06:44

    RFID標簽在垃圾分類的應用

    二、RFID標簽在垃圾分類中的優(yōu)勢高效率:RFID可以快速批量讀取垃圾信息,大幅縮短操作時間,提高垃圾分類效率。準確性:RFID減少了人工操作的錯誤率,提高了垃圾分類的準確性和可靠性。實時性:通過
    的頭像 發(fā)表于 07-31 16:48 ?882次閱讀
    RFID標簽在垃圾<b class='flag-5'>分類</b>的應用

    產(chǎn)品分類管理API接口

    ? 產(chǎn)品分類管理是現(xiàn)代電商、庫存系統(tǒng)和內(nèi)容管理平臺的核心功能,它通過API接口實現(xiàn)高效的分類創(chuàng)建、查詢、更新和刪除操作。本文將逐步介紹產(chǎn)品分類管理API的設計原理、關鍵功能和實現(xiàn)方法,幫助您構建可靠
    的頭像 發(fā)表于 07-25 14:20 ?577次閱讀
    產(chǎn)品<b class='flag-5'>分類</b>管理API接口

    霍爾IC的原理和分類

    霍爾IC是一種能夠進行高/低電平數(shù)字信號輸出的傳感器,便于后端驅(qū)動器和微控制器進行數(shù)據(jù)處理,因此被廣泛應用于各種白色家電和工業(yè)設備中。本頁將介紹霍爾IC的原理和分類。
    的頭像 發(fā)表于 07-08 14:28 ?2293次閱讀
    霍爾IC的原理和<b class='flag-5'>分類</b>

    用一杯咖啡的時間,讀懂AI二分類如何守護工業(yè)質(zhì)量

    您是否想過,工廠里那些"非黑即白"的判斷,正由AI用最簡潔的邏輯守護質(zhì)量?今天,讓我們通過一個零件組裝中的彈墊錯裝、漏裝、多裝、錯序分類案例,拆解AI二分類技術的核心
    的頭像 發(fā)表于 07-08 07:35 ?963次閱讀
    用一杯咖啡的時間,讀懂AI二<b class='flag-5'>分類</b>如何守護工業(yè)質(zhì)量

    風華貼片電感的標準分類體系

    作為國內(nèi)電子元器件領域的領軍企業(yè),風華高科通過構建多維度分類體系,實現(xiàn)了貼片電感產(chǎn)品的精準定位與高效應用。其分類邏輯融合了結(jié)構特征、功能特性及場景適配性,形成了涵蓋產(chǎn)品形態(tài)、技術參數(shù)、應用領域
    的頭像 發(fā)表于 05-19 14:04 ?781次閱讀
    風華貼片電感的標準<b class='flag-5'>分類</b>體系

    ?電源管理芯片的分類

    電源管理芯片的分類 電源管理芯片涵蓋電壓轉(zhuǎn)換、電池管理、驅(qū)動控制等核心功能,并適配汽車、消費電子、工業(yè)等多樣化場景,技術向高集成度與智能化推進。 一、按核心功能分類 電壓轉(zhuǎn)換 AC/DC調(diào)制芯片
    的頭像 發(fā)表于 05-12 11:49 ?2445次閱讀
    ?電源管理芯片的<b class='flag-5'>分類</b>

    Ethercat轉(zhuǎn)Profinet網(wǎng)關如何用“協(xié)議翻譯術”打通自動化產(chǎn)線任督二脈

    Ethercat轉(zhuǎn)Profinet網(wǎng)關如何用“協(xié)議翻譯術”打通自動化產(chǎn)線任督二脈
    的頭像 發(fā)表于 05-10 14:42 ?650次閱讀
    Ethercat轉(zhuǎn)Profinet網(wǎng)關如<b class='flag-5'>何用</b>“協(xié)議翻譯術”打通自動化產(chǎn)線任督二脈
    景东| 蒙阴县| 元江| 新绛县| 万荣县| 宁夏| 丘北县| 衡山县| 玉山县| 永定县| 杭州市| 长白| 简阳市| 芦溪县| 晋城| 普定县| 婺源县| 大兴区| 巴中市| 开化县| 秦安县| 泰安市| 石林| 汉源县| 汪清县| 桑日县| 浦东新区| 兰坪| 郯城县| 印江| 平度市| 白水县| 讷河市| 楚雄市| 宁城县| 会东县| 汽车| 怀远县| 海口市| 北京市| 明溪县|