哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

教你如何利用二位交互圖理解機(jī)器學(xué)習(xí)

算法與數(shù)據(jù)結(jié)構(gòu) ? 來源:未知 ? 作者:佚名 ? 2017-11-11 08:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來自:naughty 的博客

https://my.oschina.net/taogang/blog/1544709

每當(dāng)提到機(jī)器學(xué)習(xí),大家總是被其中的各種各樣的算法和方法搞暈,覺得無從下手。確實(shí),機(jī)器學(xué)習(xí)的各種套路確實(shí)不少,但是如果掌握了正確的路徑和方法,其實(shí)還是有跡可循的,這里我推薦SAS的Li Hui的這篇博客,講述了如何選擇機(jī)器學(xué)習(xí)的各種方法。

另外,Scikit-learn 也提供了一幅清晰的路線圖給大家選擇:

其實(shí)機(jī)器學(xué)習(xí)的基本算法都很簡單,下面我們就利用二維數(shù)據(jù)和交互圖形來看看機(jī)器學(xué)習(xí)中的一些基本算法以及它們的原理。(另外向Bret Victor致敬,他的 Inventing on principle 深深的影響了我)

所有的代碼即演示可以在我的Codepen的這個Collection中找到。

首先,機(jī)器學(xué)習(xí)最大的分支的監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí),簡單說數(shù)據(jù)已經(jīng)打好標(biāo)簽的是監(jiān)督學(xué)習(xí),而數(shù)據(jù)沒有標(biāo)簽的是無監(jiān)督學(xué)習(xí)。從大的分類上看,降維和聚類被劃在無監(jiān)督學(xué)習(xí),回歸和分類屬于監(jiān)督學(xué)習(xí)。

無監(jiān)督學(xué)習(xí)

如果你的數(shù)據(jù)都沒有標(biāo)簽,你可以選擇花錢請人來標(biāo)注你的數(shù)據(jù),或者使用無監(jiān)督學(xué)習(xí)的方法

首先你可以考慮是否要對數(shù)據(jù)進(jìn)行降維。

降維

降維顧名思義就是把高維度的數(shù)據(jù)變成為低維度。常見的降維方法有PCA, LDA, SVD等。

主成分分析 PCA

降維里最經(jīng)典的方法是主成分分析PCA,也就是找到數(shù)據(jù)的主要組成成分,拋棄掉不重要的成分。

這里我們先用鼠標(biāo)隨機(jī)生成8個數(shù)據(jù)點(diǎn),然后繪制出表示主成分的白色直線。這根線就是二維數(shù)據(jù)降維后的主成分,藍(lán)色的直線是數(shù)據(jù)點(diǎn)在新的主成分維度上的投影線,也就是垂線。主成分分析的數(shù)學(xué)意義可以看成是找到這根白色直線,使得投影的藍(lán)色線段的長度的和為最小值。

聚類

因?yàn)樵诜潜O(jiān)督學(xué)習(xí)的環(huán)境下,數(shù)據(jù)沒有標(biāo)簽,那么能對數(shù)據(jù)所做的最好的分析除了降維,就是把具有相同特質(zhì)的數(shù)據(jù)歸并在一起,也就是聚類。

層級聚類 Hierachical Cluster

該聚類方法用于構(gòu)建一個擁有層次結(jié)構(gòu)的聚類

如上圖所示,層級聚類的算法非常的簡單:

1、初始時刻,所有點(diǎn)都自己是一個聚類

2、找到距離最近的兩個聚類(剛開始也就是兩個點(diǎn)),形成一個聚類

3、兩個聚類的距離指的是聚類中最近的兩個點(diǎn)之間的距離

4、重復(fù)第二步,直到所有的點(diǎn)都被聚集到聚類中。

KMeans

KMeans中文翻譯K均值算法,是最常見的聚類算法。

1、隨機(jī)在圖中取K(這里K=3)個中心種子點(diǎn)。

2、然后對圖中的所有點(diǎn)求到這K個中心種子點(diǎn)的距離,假如點(diǎn)P離中心點(diǎn)S最近,那么P屬于S點(diǎn)的聚類。

3、接下來,我們要移動中心點(diǎn)到屬于他的“聚類”的中心。

4、然后重復(fù)第2)和第3)步,直到,中心點(diǎn)沒有移動,那么算法收斂,找到所有的聚類。

KMeans算法有幾個問題:

1、如何決定K值,在上圖的例子中,我知道要分三個聚類,所以選擇K等于3,然而在實(shí)際的應(yīng)用中,往往并不知道應(yīng)該分成幾個類

2、由于中心點(diǎn)的初始位置是隨機(jī)的,有可能并不能正確分類,大家可以在我的Codepen中嘗試不同的數(shù)據(jù)

3、如下圖,如果數(shù)據(jù)的分布在空間上有特殊性,KMeans算法并不能有效的分類。中間的點(diǎn)被分別歸到了橙色和藍(lán)色,其實(shí)都應(yīng)該是藍(lán)色。

DBSCAN

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)中文是基于密度的聚類算法。

DBSCAN算法基于一個事實(shí):一個聚類可以由其中的任何核心對象唯一確定。

算法的具體聚類過程如下:

1、掃描整個數(shù)據(jù)集,找到任意一個核心點(diǎn),對該核心點(diǎn)進(jìn)行擴(kuò)充。擴(kuò)充的方法是尋找從該核心點(diǎn)出發(fā)的所有密度相連的數(shù)據(jù)點(diǎn)(注意是密度相連)。

2、遍歷該核心點(diǎn)的鄰域內(nèi)的所有核心點(diǎn)(因?yàn)檫吔琰c(diǎn)是無法擴(kuò)充的),尋找與這些數(shù)據(jù)點(diǎn)密度相連的點(diǎn),直到?jīng)]有可以擴(kuò)充的數(shù)據(jù)點(diǎn)為止。最后聚類成的簇的邊界節(jié)點(diǎn)都是非核心數(shù)據(jù)點(diǎn)。

3、之后就是重新掃描數(shù)據(jù)集(不包括之前尋找到的簇中的任何數(shù)據(jù)點(diǎn)),尋找沒有被聚類的核心點(diǎn),再重復(fù)上面的步驟,對該核心點(diǎn)進(jìn)行擴(kuò)充直到數(shù)據(jù)集中沒有新的核心點(diǎn)為止。數(shù)據(jù)集中沒有包含在任何簇中的數(shù)據(jù)點(diǎn)就構(gòu)成異常點(diǎn)。

如上圖所示,DBSCAN可以有效的解決KMeans不能正確分類的數(shù)據(jù)集。并且不需要知道K值。

當(dāng)然,DBCSAN還是要決定兩個參數(shù),如何決定這兩個參數(shù)是分類效果的關(guān)鍵因素:

1、一個參數(shù)是半徑(Eps),表示以給定點(diǎn)P為中心的圓形鄰域的范圍;

2、另一個參數(shù)是以點(diǎn)P為中心的鄰域內(nèi)最少點(diǎn)的數(shù)量(MinPts)。如果滿足:以點(diǎn)P為中心、半徑為Eps的鄰域內(nèi)的點(diǎn)的個數(shù)不少于MinPts,則稱點(diǎn)P為核心點(diǎn)。

監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí)中的數(shù)據(jù)要求具有標(biāo)簽。也就是說針對已有的結(jié)果去預(yù)測新出現(xiàn)的數(shù)據(jù)。如果要預(yù)測的內(nèi)容是數(shù)值類型,我們稱作回歸,如果要預(yù)測的內(nèi)容是類別或者是離散的,我們稱作分類。

其實(shí)回歸和分類本質(zhì)上是類似的,所以很多的算法既可以用作分類,也可以用作回歸。

回歸

線性回歸

線性回歸是最經(jīng)典的回歸算法。

在統(tǒng)計學(xué)中,線性回歸(Linear regression)是利用稱為線性回歸方程的最小二乘函數(shù)對一個或多個自變量和因變量之間關(guān)系進(jìn)行建模的一種回歸分析。

這種函數(shù)是一個或多個稱為回歸系數(shù)的模型參數(shù)的線性組合。 只有一個自變量的情況稱為簡單回歸,大于一個自變量情況的叫做多元回歸。

如上圖所示,線性回歸就是要找到一條直線,使得所有的點(diǎn)預(yù)測的失誤最小。也就是圖中的藍(lán)色直線段的和最小。這個圖很像我們第一個例子中的PCA。仔細(xì)觀察,分辨它們的區(qū)別。

如果對于算法的的準(zhǔn)確性要求比較高,推薦的回歸算法包括:隨機(jī)森林,神經(jīng)網(wǎng)絡(luò)或者Gradient Boosting Tree。

如果要求速度優(yōu)先,建議考慮決策樹和線性回歸。

分類

支持向量機(jī) SVM

如果對于分類的準(zhǔn)確性要求比較高,可使用的算法包括Kernel SVM,隨機(jī)森林,神經(jīng)網(wǎng)絡(luò)以及Gradient Boosting Tree。

給定一組訓(xùn)練實(shí)例,每個訓(xùn)練實(shí)例被標(biāo)記為屬于兩個類別中的一個或另一個,SVM訓(xùn)練算法創(chuàng)建一個將新的實(shí)例分配給兩個類別之一的模型,使其成為非概率二元線性分類器。

SVM模型是將實(shí)例表示為空間中的點(diǎn),這樣映射就使得單獨(dú)類別的實(shí)例被盡可能寬的明顯的間隔分開。然后,將新的實(shí)例映射到同一空間,并基于它們落在間隔的哪一側(cè)來預(yù)測所屬類別。

如上圖所示,SVM算法就是在空間中找到一條直線,能夠最好的分割兩組數(shù)據(jù)。使得這兩組數(shù)據(jù)到直線的距離的絕對值的和盡可能的大。

上圖示意了不同的核方法的不同分類效果。

決策樹

如果要求分類結(jié)果是可以解釋的,可以考慮決策樹或者邏輯回歸。

決策樹(decision tree)是一個樹結(jié)構(gòu)(可以是二叉樹或非二叉樹)。

其每個非葉節(jié)點(diǎn)表示一個特征屬性上的測試,每個分支代表這個特征屬性在某個值域上的輸出,而每個葉節(jié)點(diǎn)存放一個類別。

使用決策樹進(jìn)行決策的過程就是從根節(jié)點(diǎn)開始,測試待分類項(xiàng)中相應(yīng)的特征屬性,并按照其值選擇輸出分支,直到到達(dá)葉子節(jié)點(diǎn),將葉子節(jié)點(diǎn)存放的類別作為決策結(jié)果。

決策樹可以用于回歸或者分類,下圖是一個分類的例子。

如上圖所示,決策樹把空間分割成不同的區(qū)域。

邏輯回歸

邏輯回歸雖然名字是回歸,但是卻是個分類算法。因?yàn)樗蚐VM類似是一個二分類,數(shù)學(xué)模型是預(yù)測1或者0的概率。所以我說回歸和分類其實(shí)本質(zhì)上是一致的。

這里要注意邏輯回歸和線性SVM分類的區(qū)別

樸素貝葉斯

當(dāng)數(shù)據(jù)量相當(dāng)大的時候,樸素貝葉斯方法是一個很好的選擇。

15年我在公司給小伙伴們分享過bayers方法,可惜speaker deck被墻了,如果有興趣可以自行想辦法。

如上圖所示,大家可以思考一下左下的綠點(diǎn)對整體分類結(jié)果的影響。

KNN

KNN分類可能是所有機(jī)器學(xué)習(xí)算法里最簡單的一個了。

如上圖所示,K=3,鼠標(biāo)移動到任何一個點(diǎn),就找到距離該點(diǎn)最近的K個點(diǎn),然后,這K個點(diǎn)投票,多數(shù)表決獲勝。就是這么簡單。

總結(jié)

本文利用二維交互圖幫助大家理解機(jī)器學(xué)習(xí)的基本算法,希望能增加大家對機(jī)器學(xué)習(xí)的各種方法有所了解。所有的代碼可以在參考中找到。歡迎大家來和我交流。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:圖解機(jī)器學(xué)習(xí)

文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數(shù)據(jù)結(jié)構(gòu)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    智能機(jī)器人從0到1系統(tǒng)入門課程 帶源碼課件 百度網(wǎng)盤下載

    的深度理解。然而,未來的機(jī)器交互必然是多模態(tài)融合的——即“聽覺”與“視覺”的深度協(xié)同。通過結(jié)合語音識別與視覺識別技術(shù),我們不僅能賦予機(jī)器人“聽懂人話”的能力,更能讓它擁有“看懂世界”
    發(fā)表于 04-11 16:41

    25Hz軌道電路高頻開關(guān)電源的研究

    在電氣化鐵道,采用二位相敏繼電器檢測線路上是否有機(jī)車通過。二位相敏繼電器的工作原理是在其上加兩組25Hz、相位差為90°的110V和220V交流電源時,
    的頭像 發(fā)表于 03-14 16:42 ?3425次閱讀
    25Hz軌道電路高頻開關(guān)電源的研究

    穿孔機(jī)頂頭檢測儀 機(jī)器視覺深度學(xué)習(xí)

    ,能適用惡劣工況,在粉塵、高溫、氧化皮等惡劣環(huán)境中均可正常工作。 測量原理 利用頂頭與周圍的物質(zhì)(水、空氣、導(dǎo)盤等)紅外輻射能量的差異,用熱成像相機(jī)拍攝出清晰的圖片,再通過深度學(xué)習(xí)短時間內(nèi)深度優(yōu)化,判斷
    發(fā)表于 12-22 14:33

    芯導(dǎo)科技AI智能交互硬件方案介紹

    AI智能交互硬件是通過集成人工智能技術(shù)(如大語言模型、多模態(tài)交互、機(jī)器學(xué)習(xí)等),賦予傳統(tǒng)玩具智能化交互能力的新型產(chǎn)品。其核心特點(diǎn)是?擬人化
    的頭像 發(fā)表于 12-03 17:00 ?2632次閱讀
    芯導(dǎo)科技AI智能<b class='flag-5'>交互</b>硬件方案介紹

    從0到1,10+年資深LabVIEW專家,手把手教你攻克機(jī)器視覺+深度學(xué)習(xí)(5000分鐘實(shí)戰(zhàn)課)

    “告別檢測系統(tǒng)能力缺陷!10+年LabVIEW視覺資深專家手把手教你:5000+分鐘高清教程(含工具、算法原理、實(shí)戰(zhàn)操作、項(xiàng)目優(yōu)化全流程講解)”——從傳統(tǒng)視覺算法→深度學(xué)習(xí)建?!I(yè)級部署"
    的頭像 發(fā)表于 12-02 08:07 ?738次閱讀
    從0到1,10+年資深LabVIEW專家,手把手<b class='flag-5'>教你</b>攻克<b class='flag-5'>機(jī)器</b>視覺+深度<b class='flag-5'>學(xué)習(xí)</b>(5000分鐘實(shí)戰(zhàn)課)

    RK3576機(jī)器人核心:三屏異顯+八路攝像頭,重塑機(jī)器交互與感知

    引擎,訪問并顯示米爾官方網(wǎng)頁,承擔(dān)人機(jī)信息查詢與交互角色。· MINI DP接口(27寸顯示器):實(shí)時顯示8路攝像頭捕捉的圖像預(yù)覽,充當(dāng)機(jī)器人的"視覺監(jiān)控中心"
    發(fā)表于 10-29 16:41

    自動駕駛中常提的“強(qiáng)化學(xué)習(xí)”是個啥?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,有些方案中會提到“強(qiáng)化學(xué)習(xí)(Reinforcement Learning,簡稱RL)”,強(qiáng)化學(xué)習(xí)是一類讓機(jī)器通過試錯來學(xué)會做決策的技術(shù)。簡單理解
    的頭像 發(fā)表于 10-23 09:00 ?875次閱讀
    自動駕駛中常提的“強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>”是個啥?

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實(shí)的編程技能才能真正掌握并合理使用這項(xiàng)技術(shù)。事實(shí)上,這種印象忽視了該技術(shù)為機(jī)器視覺(乃至生產(chǎn)自動化)帶來的潛力,因?yàn)樯疃?b class='flag-5'>學(xué)習(xí)并非只屬于計算機(jī)科學(xué)家或程序員。 從頭開始:什么
    的頭像 發(fā)表于 09-10 17:38 ?1042次閱讀
    如何在<b class='flag-5'>機(jī)器</b>視覺中部署深度<b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    語音機(jī)器交互系統(tǒng):核心技術(shù)與應(yīng)用挑戰(zhàn)

    ? ? ? 語音機(jī)器交互系統(tǒng)是融合多學(xué)科技術(shù)的復(fù)雜工程,其核心目標(biāo)是實(shí)現(xiàn)人與機(jī)器間的自然、流暢語音對話。該系統(tǒng)已廣泛應(yīng)用于智能客服、智能家居、企業(yè)助手等場景,其技術(shù)架構(gòu)主要包含以下幾個關(guān)鍵模塊
    的頭像 發(fā)表于 09-02 11:08 ?982次閱讀

    再掀語音交互革命,廣和通AI解決方案加速機(jī)器人聽覺進(jìn)化

    機(jī)器人世界里,感知是智能化的第一步,是機(jī)器人獲取環(huán)境信息,學(xué)習(xí)適應(yīng)并自主決策的前提。聽覺作為五感之一,深度融合AI,可幫助機(jī)器人實(shí)現(xiàn)高效感知、數(shù)據(jù)獲取、語音
    的頭像 發(fā)表于 08-26 17:44 ?1031次閱讀

    2025科大訊飛智能交互產(chǎn)品升級發(fā)布會定檔

    從命令行到圖形界面,從觸屏操作到語音助手,技術(shù)浪潮重新定義人機(jī)交互的邊界。當(dāng)大模型的智慧涌現(xiàn),機(jī)器從“能聽會說”真正走向“能理解會思考”,那么未來交互的新范式將是什么?
    的頭像 發(fā)表于 06-11 17:12 ?1376次閱讀

    詳細(xì)介紹機(jī)場智能指路機(jī)器人的工作原理

    免與行人發(fā)生碰撞,為旅客提供安全、舒適的引導(dǎo)服務(wù)。 智能交互系統(tǒng) 語音識別與理解 :智能指路機(jī)器利用先進(jìn)的語音識別技術(shù),將旅客輸入的語音信號轉(zhuǎn)化為文字信息。然后,通過自然語言處理算
    發(fā)表于 05-10 18:26

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    閱讀心得體會:ROS2機(jī)器人視覺與地圖構(gòu)建技術(shù) 通過對本書第7章(ROS2視覺應(yīng)用)和第8章(ROS2地構(gòu)建)的學(xué)習(xí),我對機(jī)器人視覺感知和自主導(dǎo)航的核心技術(shù)有了更深入的
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】機(jī)器人入門的引路書

    的限制和調(diào)控) 本書還有很多前沿技術(shù)項(xiàng)目的擴(kuò)展 比如神經(jīng)網(wǎng)絡(luò)識別例程,機(jī)器學(xué)習(xí)圖像識別的原理,yolo圖像追蹤的原理 機(jī)器學(xué)習(xí)訓(xùn)練三大點(diǎn): 先準(zhǔn)備一個基本的模型結(jié)構(gòu) 和訓(xùn)練時的反饋函
    發(fā)表于 04-30 01:05

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】+ROS2應(yīng)用案例

    整書的內(nèi)容非常多有476頁。非常厚,像本厚厚的工具書 拿出文章中的小節(jié)加以書寫吧 視覺應(yīng)用:維碼識別 維碼識別是視覺應(yīng)用中的一個重要部分,它在機(jī)器人導(dǎo)航、物品追蹤和信息交互等方面有
    發(fā)表于 04-27 11:42
    龙陵县| 通许县| 县级市| 二手房| 台中县| 张掖市| 永福县| 阳谷县| 依安县| 鄂温| 武胜县| 阳西县| 龙南县| 阿拉善左旗| 鄄城县| 西乌珠穆沁旗| 三明市| 教育| 恩平市| 灯塔市| 剑阁县| 洮南市| 大关县| 惠安县| 永登县| 汉川市| 花莲市| 武陟县| 台北县| 阜宁县| 石棉县| 应用必备| 三门峡市| 宝坻区| 泰和县| 武功县| 吉林省| 新密市| 西畴县| 滦南县| 南陵县|