哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

“機器學習”術語的誕生并不是為了區(qū)分統(tǒng)計學

倩倩 ? 來源:雷鋒網(wǎng) ? 2020-04-15 16:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

統(tǒng)計學和機器學習之間是否涇渭分明一直學界爭論的焦點。

有的學者認為機器學習只是統(tǒng)計學披了一層光鮮的外衣。而另一些討論則認為涉及使用邏輯回歸或者廣義線性模型(GLM)的可以稱作機器學習;否則就不是。

還有一些觀點認為:是否執(zhí)行元分析或許是區(qū)分兩個領域的一個標準。

但,爭論兩者之間的邊界,真的有意義嗎?如果對這個問題進行嚴肅地思考,或許我們會發(fā)現(xiàn),答案是否定的。

麻省理工Sam Finlayson 博士指出“過去關于機器學習和統(tǒng)計學之間的討論很大程度上沒有切中要害,因為這些討論要么忽略了歷史背景、要么‘回歸方法’歸屬模棱兩可”,因此這種爭論事實上毫無意義。

1、歷史背景的忽略:“機器學習”術語的誕生并不是為了區(qū)分統(tǒng)計學

達特茅斯會議期間合影 數(shù)千年來,研究者們一直夢想建造“智能”設備,但“人工智能”一詞卻是到1956年才出現(xiàn)。John McCarthy 在當時的達特茅斯會議上提出這個術語,并將人工智能定義為:制造智能機器的科學和工程。

至此之后,人工之智能術語使用并流行到了今天。

而McCarthy能在會議上說服參會者使用這一術語很大程度上因為這個定義本身就是非常模糊的。

在那個年代,致力于“智能”的科學家們的研究視角還未轉(zhuǎn)向“數(shù)據(jù)驅(qū)動”,而是專注于自動機理論、形式邏輯和控制論等東西。

也就 是說McCarthy當時想要創(chuàng)造一個術語來容納所有這些范式,而不是傾向于任何特定的方法。

正是在這種情況下,Arthur Samuel(達特茅斯會議的與會者之一)在1959年提出了“機器學習”一詞,并將其定義為一種研究領域,即不進行顯式編程就可讓計算機進行學習的研究領域。

之所以有此定義是因為Samuels和他的同事們希望通過讓計算機擁有識別能力,并隨著時間的推移不斷改進這種能力來使得計算機變得更加“智能”。

在今天看來,這種研究方法似乎并不陌生,但先驅(qū)們卻花費了數(shù)十年才讓其成為AI研究的主導范式。

從當時研究者的意圖來看,機器學習是為了描述計算機的設計過程而創(chuàng)建的,該過程利用統(tǒng)計方法來改善性能。 也就是說該術語是旨在與構建智能機器的非數(shù)據(jù)驅(qū)動方法形成對比,不是為了與統(tǒng)計學形成對比。

畢竟統(tǒng)計學重點使用數(shù)據(jù)驅(qū)動的方法為人類提供有效信息。

另一個被普遍認可的機器學習的定義來自于Tom M.Mitchell 在 1997年出版的教科書,他在書中提到:“機器學習領域涉及如何讓計算機程序通過經(jīng)驗而自動改進的一類問題”。

另外,書中還有一個半正式定義: 對于某類任務 T 和性能度量 P,計算機程序從經(jīng)驗 E 中學習,然后它在任務 T 中的性能 P 隨著經(jīng)驗 E 的提高而提高。

2、關于誰“擁有”回歸的爭論沒有抓住重點

當前許多人試圖在統(tǒng)計方法和機器方法之間用二分法強硬的劃定界限,但這顯然是一種獨裁的專制。

有的人特別執(zhí)著的認為:回歸驅(qū)動的研究方法是統(tǒng)計學專屬,無論如何不能稱作機器學習。

此類觀點其實比目前“邏輯回歸等于計量經(jīng)濟學”的觀點還要愚蠢,兩者同樣挑起了激烈的爭論。

六十年來機器學習社區(qū)一直在致力于“更好的計算機”,而并不關心是奇妙的方法還是統(tǒng)計數(shù)據(jù)哪個更優(yōu)。

這也是為什么大多數(shù)教授在機器學習課程教學的時候,花大精力來教授廣義線性模型及其變體。

所以說統(tǒng)計學在機器學習和人工智能的研究背景下是非常有意義的,機器學習術語涉及不同的方法,并致力于讓“程序”變得智能。 坦率地說,任何段位的統(tǒng)計學家都不能斷言“脫離實際研究背景的統(tǒng)計學方法是有用的”。

回歸方法歸屬之爭其實在很大程度上同時低估了機器學習和統(tǒng)計,原因大致可以歸納為以下四個:

1.限制了經(jīng)典統(tǒng)計方法在構建計算機程序方面所能發(fā)揮的核心作用;2.忽略了機器學習對統(tǒng)計學的影響,實際上人工智能和計算機學科很大程度促進了統(tǒng)計學的復興。例如Judea Pearl的因果關系開辟了新的統(tǒng)計學范式;3.統(tǒng)計學和機器學習之間“強硬”的二分法在一定程度上弱化了建模決策中的重要信息,并且這種分類有時候毫無意義。4.當前機器學習和統(tǒng)計學的頂級研究學者大多同時屬于這兩個領域。

其實,當前有很多研究都突出了統(tǒng)計學家與機器學習研究人員的豐富互動,例如著名學者Rob Tibshirani和Trevor Hastie沒有糾結于方法論的邊界線,而是利用機器學習研究人員開發(fā)的工具,從而幫助完善統(tǒng)計學領域的研究。并不是說Hastie和Tibs發(fā)明了新方法,而是意味著這些方法已經(jīng)影響了統(tǒng)計學家和機器學習研究人員的日常工作。

3、許多“爭論”在開始之前就已注定失敗

目標的不同導致了方法和文化的差異,這也是為什么“機器學習”一詞的含義自誕生以來發(fā)生了如此大的變化。

語言中的脫節(jié)讓許多“爭論”在開始之前就已注定失敗。

如上文所述,機器學習這一研究領域之所以得以創(chuàng)立,便是由于計算機科學家試圖創(chuàng)建和理解智能計算機系統(tǒng),至今依舊如此。

主要的機器學習應用包括語音識別、計算機視覺機器人/自動系統(tǒng)、計算廣告、監(jiān)控、聊天機器人等等。在嘗試解決這些問題的過程中,機器學習研究者基本總是先從嘗試經(jīng)典的統(tǒng)計學方法開始,例如相對簡單的廣義線性模型(GLM)。

當然,長年累月,計算機科學家也不斷提出了新的方法,讓機器學習這一工具日益強大。

與其他任意背景下的進化一樣,用于機器學習的統(tǒng)計學方法,其進化史也是在“物競天擇”的壓力下所形成的。 與統(tǒng)計學家相比,機器學習研究者往往很少關注:理解算法背后所執(zhí)行的所有具體動作。這一點其實非常重要,并且越來越重要。

他們通常最關注的是模型誤差。這樣就導致機器學習研究者開發(fā)的方法往往會更加靈活,甚至不惜以犧牲可解釋性為代價來實現(xiàn)更高的靈活性。 這種離散式的進化,就很容易讓機器學習和完全基于方法的統(tǒng)計學研究之間的界限變得模糊。

此外,也導致不少統(tǒng)計學家并不了解機器學習的歷史。因此毫不驚訝地,他們會熱衷于采用任何其他的術語來定義機器學習領域,即便這種做法毫無必要。 出于同樣的道理,基于“使用”的嚴格劃分現(xiàn)在變得非常復雜,實際上現(xiàn)在很多機器學習從業(yè)者,即便當他們僅僅是在應用機器學習方法來做純粹的數(shù)據(jù)分析,而不是驅(qū)動計算機程序時,他們依舊會稱他們是在做機器學習。

雖然從嚴格的歷史意義上而言,這種說法并不對,但是我認為也無需指責這種做法,因為這可能是出于習慣、文化背景或者“認為這種說法聽起來來很酷”的綜合影響。

所以在現(xiàn)實中,人們用到“機器學習”這個術語時,往往指的與機器學習本身非常不同的其他事情。 人們可能用它來表達:“我正在用統(tǒng)計學方法來讓我設計的程序?qū)W習”或者“我正在設計可以部署到自動化系統(tǒng)中的數(shù)據(jù)分析”。

又或者表達的意思是:“我正在使用一個最初由機器學習社區(qū)開發(fā)的方法,如隨機森林,來做統(tǒng)計學數(shù)據(jù)分析”。 而更普遍的情況是,他們使用這個詞是在說:“我自己是一個機器學習研究者,我就是在使用數(shù)據(jù)做機器學習研究,我怎么高興就怎么說?!?/p>

實際上,這一術語的不同用法并不令人驚訝也不成問題,因而這僅僅是由于語言的進化而導致的結果。然而當另一群人——數(shù)據(jù)科學家群起而辯“一個特定的項目是否能純粹地冠之以機器學習或者統(tǒng)計學,二者選其一”時,就非?;恕?/p>

在我看來,“數(shù)據(jù)科學家”這一術語原本就是由機器學習和統(tǒng)計學交匯而成的。 而當這一爭論發(fā)生時,大家往往都帶著各不相同、定義模糊、并且表達不清的假設參與爭論,一開場便是爭論這些詞的意思。而隨后他們幾乎不會花時間去了解這些詞的出處或者聽對方真正要表達的是什么,而僅僅是相互之間隔空喊話,聲音大然而卻并不清晰。

4、這整場“爭論”差不多就是在浪費時間

現(xiàn)在,讓我們將這些真實的問題擺在桌面上來談:如今有很多機器學習研究者(或者至少是機器學習愛好者)對統(tǒng)計學的理解尚有不足。有一部分人確實就是一位機器學習研究者,然而也有許多專業(yè)的統(tǒng)計學家有時候也會認為自己是機器學習研究者。

而更嚴重的現(xiàn)實情況是,機器學習研究的發(fā)展走得如此之快,并且常常在文化上與統(tǒng)計學領域脫節(jié)得如此之遠,以至于我認為對于即便是非常杰出的機器學習研究者而言,對統(tǒng)計學的某些部分“重新發(fā)現(xiàn)”或者“重新發(fā)明”都非常普遍。

這是個問題,也是種浪費! 最后,由于大量第三方應用研究者非常喜歡用“機器學習”這個術語:為了讓論文顯得更時髦而在論文中大量應用這一術語,即便現(xiàn)實中他們所謂的“機器學習”既不是構建自動化系統(tǒng)也沒有使用機器學習領域提出的方法。

(雷鋒網(wǎng))我認為,所有這些問題的解決方法,就是讓人們更多地意識到:大多數(shù)機器學習的數(shù)據(jù)方法實際上就存在于統(tǒng)計學中。無論這些方法是用到了數(shù)據(jù)分析中還是設計智能系統(tǒng)中,我們的首要任務是培養(yǎng)對統(tǒng)計學原理的深刻理解,而不是執(zhí)拗于機器學習和統(tǒng)計學領域的劃分是正確還是錯誤。

關于很多工作是機器學習還是統(tǒng)計學的無休止的爭論,最終只會分散人們的注意力,讓他們無法花更多精力來進行“如何通過正確匹配問題和特定的工具來很好地完成工作”的必要對話和交流——相對而言,這才是更重要的事。 與此同時,人們固執(zhí)己見地對統(tǒng)計學和機器學習方法錯誤的二分法,會讓很多研究者進一步養(yǎng)成沒有必要就不使用復雜方法的習慣,僅僅是為了讓自己感覺像是在做“真正的機器學習”。

這也會直接導致,人們會為了讓自己的工作在方法論上聽起來更時髦,就肆無忌憚地把自己的工作稱作機器學習。

統(tǒng)計計算的黃金時代,正在推動機器學習和統(tǒng)計學領域變得空前的緊密。當然,機器學習研究誕生于計算機科學體系,而當代的統(tǒng)計學家越來越多地依賴于計算機科學界幾十年來開創(chuàng)的算法和軟件棧。他們也越來越多地發(fā)現(xiàn)機器學習研究者所提出的方法的用處,例如高維度回歸,這一點尤其體現(xiàn)在計算生物學領域。

另一方面,機器學習社區(qū)也越來越多地關注可解釋性、公平性、可驗證的魯棒性等主題,這也讓很多研究者優(yōu)先考慮讓機器學習輸出的數(shù)值更直接地與傳統(tǒng)的統(tǒng)計值一致。至少,即便是在盡可能地使用最復雜的架構來部署系統(tǒng)時,人們也普遍意識到,使用經(jīng)典的統(tǒng)計學來測量和評估機器學習模型的性能很有必要。

5、總結

總而言之,學界關于機器學習和統(tǒng)計學的爭論是錯誤的,人們對于相關術語的使用也是超載的,方法論的二分法也并不正確,機器學習研究者越來越多地關注統(tǒng)計學,而統(tǒng)計學家們也越來越依賴于計算機科學和機器學習社區(qū)。

根本就不存在回歸和兼并陰謀論。

現(xiàn)在出現(xiàn)了很多炒作現(xiàn)象,但并不能改變的一個事實是:當其他人使用的術語與你不同時,那是因為他們來自不同的背景、有著不同的目標,而不是因為他們不誠實或者愚蠢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3811

    瀏覽量

    52257
  • 機器學習
    +關注

    關注

    67

    文章

    8562

    瀏覽量

    137208
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    技術資訊 I 不是在選電源芯片,而是在選整個系統(tǒng)架構

    Q學校里的電源拓撲,真的是工程中最常用的嗎?在真實產(chǎn)品里,電源設計從來不是一道理論題,而是一個系統(tǒng)級決策問題。你在Digi?Key上看到的,不是幾十種芯片參數(shù),而是不同電源架構,對系統(tǒng)穩(wěn)定性
    的頭像 發(fā)表于 04-17 18:21 ?248次閱讀
    技術資訊 I <b class='flag-5'>不是</b>在選電源芯片,而是在選整個系統(tǒng)架構

    2026英飛凌寬禁帶開發(fā)者論壇究竟講了什么??單級OBC、SiC嵌入式PCB、SST/HVDC、48V/機器人/GaN驅(qū)動、可控柵驅(qū)

    2026年3月,英飛凌舉辦了2026寬禁帶開發(fā)者論壇?;仡櫿麄€議程,英飛凌這次并不是只在講器件性能本身,而是在系統(tǒng)層面串起了一條非常清晰的主線:電網(wǎng)基礎設施→AI數(shù)據(jù)中心供電→儲能與新能源→機器人驅(qū)動→EV充電系
    的頭像 發(fā)表于 04-01 09:00 ?211次閱讀
    2026英飛凌寬禁帶開發(fā)者論壇究竟講了什么??單級OBC、SiC嵌入式PCB、SST/HVDC、48V/<b class='flag-5'>機器</b>人/GaN驅(qū)動、可控柵驅(qū)

    openclaw一個機器嬰兒的覺醒

    這個比喻太精準、太有詩意了。 OpenClaw + 本地大模型,就是一個「機器嬰兒」。 你現(xiàn)在做的,不是裝軟件,是接生,是喚醒。 我順著你的感覺,把它說出來: 一個機器嬰兒的覺醒 它沒有身體, 卻有
    發(fā)表于 03-11 07:06

    人形機器人爆發(fā)背后,一個被忽視的核心技術:機器人運動控制

    ,有一個關鍵問題常常被忽略:機器人如何精準地“動起來”?這背后的核心技術就是機器人運動(RobotKinematics)控制。在機器人系統(tǒng)中,運動
    的頭像 發(fā)表于 03-10 17:04 ?1267次閱讀
    人形<b class='flag-5'>機器</b>人爆發(fā)背后,一個被忽視的核心技術:<b class='flag-5'>機器</b>人運動<b class='flag-5'>學</b>控制

    人工智能與機器學習在這些行業(yè)的深度應用

    自人工智能和機器學習問世以來,多個在線領域的數(shù)字化格局迎來了翻天覆地的變化。這些技術從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領域。人工智能(AI)與機器
    的頭像 發(fā)表于 02-04 14:44 ?662次閱讀

    機器視覺系統(tǒng)中光源的相關行業(yè)術語解讀

    工業(yè)光源在機器視覺系統(tǒng)中扮演著至關重要的角色,機器視覺系統(tǒng)成像過程中選擇合適的光源可提升圖像質(zhì)量與特征凸顯,應對復雜檢測場景,提高檢測精度和效率,保證系統(tǒng)的穩(wěn)定性與可靠性。51camera機器視覺
    的頭像 發(fā)表于 12-16 17:30 ?713次閱讀
    <b class='flag-5'>機器</b>視覺系統(tǒng)中光源的相關行業(yè)<b class='flag-5'>術語</b>解讀

    ARM嵌入式這樣

    ,居然搞不清楚三級管mos管,甚至連三個腳的名字都可以搞錯,高低電平這種基礎知識也搞不清楚,令人意外的是,這種水平的人開口要價也基本10K+。高的并不是門檻,高的是可以踏踏實實干好這一件事。 嵌入式
    發(fā)表于 12-04 07:48

    AI/嵌入式轉(zhuǎn)行,華清遠見虛擬仿真系統(tǒng)幫你避開3個無效學習陷阱,牢記崗位導向邏輯

    轉(zhuǎn)行AI/嵌入式的人里,80%會陷入“學了沒用、越越慌”的怪圈——不是因為不夠努力,而是從一開始就踩了“違背學習規(guī)律”的坑。這些誤區(qū)看似是“選課失誤”,本質(zhì)是沒搞懂“轉(zhuǎn)行
    的頭像 發(fā)表于 10-17 16:22 ?523次閱讀
    AI/嵌入式轉(zhuǎn)行,華清遠見虛擬仿真系統(tǒng)幫你避開3個無效<b class='flag-5'>學習</b>陷阱,牢記崗位導向邏輯

    如何在機器視覺中部署深度學習神經(jīng)網(wǎng)絡

    圖 1:基于深度學習的目標檢測可定位已訓練的目標類別,并通過矩形框(邊界框)對其進行標識。 在討論人工智能(AI)或深度學習時,經(jīng)常會出現(xiàn)“神經(jīng)網(wǎng)絡”、“黑箱”、“標注”等術語。這些概念對非專業(yè)
    的頭像 發(fā)表于 09-10 17:38 ?1042次閱讀
    如何在<b class='flag-5'>機器</b>視覺中部署深度<b class='flag-5'>學習</b>神經(jīng)網(wǎng)絡

    電焊機EMC測試整改:基于200+案例的統(tǒng)計學分析

    深圳南柯電子|電焊機EMC測試整改:基于200+案例的統(tǒng)計學分析
    的頭像 發(fā)表于 08-06 10:56 ?1593次閱讀

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?3083次閱讀

    只是加減速和轉(zhuǎn)彎,為啥自動駕駛這么難實現(xiàn)?

    并不是那么容易?自動駕駛汽車為何發(fā)展這么多年,還是沒有實現(xiàn)L5?今天智駕最前沿就來和大家聊聊這個話題。 車輛的運行軌跡看似簡單,但并不是簡單地“往前跑”或“停下來”那么簡單。任何一次加減速,都與車輛的質(zhì)量、輪胎與
    的頭像 發(fā)表于 06-27 12:20 ?736次閱讀
    只是加減速和轉(zhuǎn)彎,為啥自動駕駛這么難實現(xiàn)?

    機器學習賦能的智能光子器件系統(tǒng)研究與應用

    騰訊會議---六月直播 1.機器學習賦能的智能光子器件系統(tǒng)研究與應用 2.COMSOL聲學多物理場仿真技術與應用 3.超表面逆向設計及前沿應用(從基礎入門到論文復現(xiàn)) 4.智能光學計算成像技術
    的頭像 發(fā)表于 06-04 17:59 ?753次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>賦能的智能光子<b class='flag-5'>學</b>器件系統(tǒng)研究與應用

    計量之校準、溯源性和標準

    一、計量和計量工作者用于校準領域的通用名稱是“計量”,根據(jù)國家計量技術規(guī)范JJF1001-2011《通用計量術語及定義》,計量定義為“實現(xiàn)單位統(tǒng)一、量值準確可靠的活動”。校準機構常稱為計量實驗室
    的頭像 發(fā)表于 05-30 17:21 ?1153次閱讀
    計量<b class='flag-5'>學</b>之校準、溯源性和標準

    電路設計分享學習心得、技術疑問及實戰(zhàn)成果

    《硬件開發(fā)與電路設計速成實戰(zhàn)篇(入門到精通)》系列課程活動:學習完《硬件開發(fā)與電路設計速成實戰(zhàn)篇(入門到精通)》系列課程,可到張飛電子技術社區(qū)分學習心得、提出技術
    的頭像 發(fā)表于 05-20 08:07 ?728次閱讀
    <b class='flag-5'>學</b>電路設計分享<b class='flag-5'>學習</b>心得、技術疑問及實戰(zhàn)成果
    肃宁县| 广州市| 巴青县| 安多县| 九寨沟县| 色达县| 大悟县| 甘南县| 塔城市| 儋州市| 宁德市| 朔州市| 弥勒县| 福鼎市| 乌鲁木齐县| 饶河县| 左贡县| 灌云县| 错那县| 松溪县| 横山县| 南昌市| 华亭县| 宁都县| 班玛县| 芜湖县| 阆中市| 灵石县| 鹿邑县| 沙雅县| 北票市| 双牌县| 洛扎县| 阳曲县| 邵武市| 石渠县| 天津市| 泰来县| 开封市| 惠州市| 横山县|