哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深入研究數(shù)據(jù)科學(xué)家使用的常見統(tǒng)計和分析技術(shù)

454398 ? 來源: 企業(yè)網(wǎng)D1Net ? 作者: Ronald Schmelzer ? 2021-01-14 16:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)科學(xué)技術(shù)如今已在許多組織中占有一席之地,數(shù)據(jù)科學(xué)家正迅速成為以數(shù)據(jù)為中心的組織最受歡迎的角色之一。數(shù)據(jù)科學(xué)的應(yīng)用程序利用機器學(xué)習(xí)等技術(shù)和大數(shù)據(jù)的力量來獲取深入的見解和新的功能,其中包括預(yù)測分析、圖像和對象識別、會話人工智能系統(tǒng)等。

事實上,那些沒有在數(shù)據(jù)科學(xué)上進行充分投資的組織可能很快落后于在數(shù)據(jù)科學(xué)方面獲得顯著競爭優(yōu)勢的競爭對手。

數(shù)據(jù)科學(xué)家可以做些什么以提供這種變革性的業(yè)務(wù)收益?數(shù)據(jù)科學(xué)領(lǐng)域是一些關(guān)鍵要素的集合:準確提取可量化數(shù)據(jù)的統(tǒng)計和數(shù)學(xué)方法;使用先進的分析技術(shù)和方法從科學(xué)角度解決數(shù)據(jù)分析的技術(shù)和算法,有助于處理大型數(shù)據(jù)集;以及可以幫助將大量數(shù)據(jù)整理成獲得高質(zhì)量見解的所需格式的工具和方法。

以下將更深入地研究數(shù)據(jù)科學(xué)家使用的常見統(tǒng)計和分析技術(shù)。其中一些數(shù)據(jù)科學(xué)技術(shù)植根于數(shù)世紀的數(shù)學(xué)和統(tǒng)計工作,而另一些技術(shù)則相對較新,利用了機器學(xué)習(xí)、深度學(xué)習(xí)和其他形式的高級分析的研究成果。

數(shù)據(jù)科學(xué)如何發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系

當(dāng)識別大量數(shù)據(jù)中的信息時,數(shù)據(jù)科學(xué)家首先需要辨別不同的數(shù)據(jù)元素如何相互關(guān)聯(lián)。例如,如果在一張圖上繪制了一堆數(shù)據(jù)點,那么如何知道它們是否有意義?

數(shù)據(jù)科學(xué)家最廣泛使用的有三種統(tǒng)計和分析技術(shù)。也許數(shù)據(jù)表示兩個或多個變量之間的關(guān)系,而其工作是繪制某種最能描述這種關(guān)系的曲線或多維平面。或者,它代表具有某種親和力的集群。其他數(shù)據(jù)可能代表不同的類別。通過發(fā)現(xiàn)這些關(guān)系,可以使數(shù)據(jù)的其他隨機性具有意義,然后可以對其進行分析和可視化,以提供組織可以用來制定決策或計劃策略的信息。

以下了解可用于執(zhí)行分析的各種數(shù)據(jù)科學(xué)技術(shù)和方法:

分類技術(shù)

在分類問題中,數(shù)據(jù)科學(xué)家要回答的首要問題是:“這些數(shù)據(jù)屬于什么類別?”將數(shù)據(jù)分類的原因很多。也許數(shù)據(jù)是手繪的圖像,人們需要知道圖像代表什么字母或數(shù)字?;蛘叽碣J款申請的數(shù)據(jù),想知道它應(yīng)該屬于“已批準”還是“已拒絕”類別。其他分類可以集中在確定患者治療方案或電子郵件是否是垃圾郵件。

數(shù)據(jù)科學(xué)家用來將數(shù)據(jù)過濾到類別中的算法和方法包括:

?決策樹。這些是分支邏輯結(jié)構(gòu),使用機器生成的參數(shù)和數(shù)值樹將數(shù)據(jù)分類為已定義的類別。

?貝葉斯分類器。利用概率的力量,貝葉斯分類器可以幫助將數(shù)據(jù)分為簡單的類別。

?支持向量機(SVM)。支持向量機的目標是繪制一條寬邊距的曲線或平面,將數(shù)據(jù)分成不同的類別。

?K-近鄰算法。該技術(shù)使用一種簡單的“惰性決策”方法,根據(jù)數(shù)據(jù)集中最鄰近的類別來確定數(shù)據(jù)點應(yīng)該屬于哪個類別。

?邏輯回歸。盡管使用了分類技術(shù),但它使用將數(shù)據(jù)擬合到一條線的想法來區(qū)分每一邊的不同類別。這條線的形狀使數(shù)據(jù)可以移至某個類別。

?神經(jīng)網(wǎng)絡(luò)。這種方法使用訓(xùn)練有素的人工神經(jīng)網(wǎng)絡(luò),尤其是具有多個隱藏層的深度學(xué)習(xí)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)已經(jīng)顯示出強大的分類能力,其中包含大量的訓(xùn)練數(shù)據(jù)。

回歸技術(shù)

如果不知道數(shù)據(jù)屬于哪一類,而是想知道不同數(shù)據(jù)點之間的關(guān)系該怎么辦?回歸的主要思想是回答以下問題:“這個數(shù)據(jù)的預(yù)測值是多少?”一個簡單的概念來自“均值回歸”的統(tǒng)計概念,它可以是一個獨立變量和一個因變量之間的直接回歸,也可以是一個試圖找到多個變量之間關(guān)系的多維回歸。

例如決策樹支持向量機(SVM)和神經(jīng)網(wǎng)絡(luò)一些分類技術(shù),也可以用來進行回歸。此外,數(shù)據(jù)科學(xué)家可以使用的回歸技術(shù)包括:

?線性回歸。作為數(shù)據(jù)科學(xué)中應(yīng)用最廣泛的方法之一,這種方法試圖根據(jù)兩個變量之間的相關(guān)性找到最適合所分析數(shù)據(jù)的曲線。

?套索回歸。Lasso(套索)是“最小絕對收縮和選擇算符”的縮寫,是一種通過在最終模型中使用數(shù)據(jù)子集來提高線性回歸模型預(yù)測準確性的技術(shù)。

?多元回歸。這涉及尋找適合可能包含多個變量的多維數(shù)據(jù)的線或平面的不同方法。

聚類和關(guān)聯(lián)分析技術(shù)

另一組數(shù)據(jù)科學(xué)技術(shù)側(cè)重于回答這樣一個問題:“這些數(shù)據(jù)是如何分組的,不同的數(shù)據(jù)點屬于哪些組?”數(shù)據(jù)科學(xué)家可以發(fā)現(xiàn)相關(guān)數(shù)據(jù)點的聚類,這些數(shù)據(jù)點具有共同的各種特征,從而在分析應(yīng)用程序中產(chǎn)生有用的信息。

可用于聚類用途的方法包括:

?K-均值聚類。K-均值算法確定數(shù)據(jù)集中的一定數(shù)量的聚類,并找到“質(zhì)心”,以標識不同聚類的位置,并將數(shù)據(jù)點分配給最接近的聚類。

?均值漂移聚類。另一種基于質(zhì)心的聚類技術(shù),它可以單獨使用,也可以通過移動指定的質(zhì)心來改進k-均值聚類。

?DBSCAN。DBSCAN是“基于密度的帶噪空間聚類算法DBSCAN”的縮寫,是另一種發(fā)現(xiàn)聚類的技術(shù),它使用一種更高級的方法來識別聚類的密度。

?高斯混合模型。高斯混合模型通過使用高斯分布將數(shù)據(jù)分組在一起而不是將數(shù)據(jù)視為奇點來幫助找到聚類。

?分層聚類。與決策樹類似,這種技術(shù)使用層次化的分支方法來查找聚類。

關(guān)聯(lián)分析是一種相關(guān)但獨立的技術(shù)。其背后的主要思想是找到描述不同數(shù)據(jù)點之間公共性的關(guān)聯(lián)規(guī)則。與聚類類似,人們正在尋找數(shù)據(jù)所屬的組。但是在這種情況下,試圖確定何時數(shù)據(jù)點一起出現(xiàn),而不是僅僅識別它們的集群。在聚類中,其目標是將大數(shù)據(jù)集劃分為可識別的組,而通過關(guān)聯(lián)分析,人們正在測量數(shù)據(jù)點之間的關(guān)聯(lián)程度。

數(shù)據(jù)科學(xué)應(yīng)用實例

數(shù)據(jù)科學(xué)工具帶中的上述方法和技術(shù)需要適當(dāng)?shù)貞?yīng)用于特定的分析問題以及可用于解決這些問題的數(shù)據(jù)。優(yōu)秀的數(shù)據(jù)科學(xué)家必須能夠理解當(dāng)前問題的本質(zhì)——是聚類、分類還是回歸?以及在給定數(shù)據(jù)特征的情況下可以產(chǎn)生所需答案的最佳算法。這就是數(shù)據(jù)科學(xué)實際上是一個科學(xué)過程而不是具有嚴格規(guī)則的過程,并允許通過編程解決問題的原因。

使用這些技術(shù),數(shù)據(jù)科學(xué)家可以處理廣泛的應(yīng)用程序,其中許多應(yīng)用程序通常出現(xiàn)在不同類型的行業(yè)和組織中。以下是一些例子:

·異常檢測。如果可以找到預(yù)期或正常數(shù)據(jù)的模式,那么也可以找到那些不符合模式的數(shù)據(jù)點。金融服務(wù)、醫(yī)療保健、零售和制造業(yè)等行業(yè)組織經(jīng)常采用各種數(shù)據(jù)科學(xué)方法來識別其數(shù)據(jù)中的異常情況,以用于欺詐檢測、客戶分析、網(wǎng)絡(luò)安全和IT系統(tǒng)監(jiān)控。異常檢測還可以用來消除數(shù)據(jù)集中的異常值,以提高分析的準確性。

·二分類和多分類。分類技術(shù)的一個主要應(yīng)用是確定某物是否屬于某一特定類別。這就是所謂的二分類,因為人們可能會問諸如“圖片中是否有貓?”之類的問題。實際的業(yè)務(wù)應(yīng)用是使用圖像識別在大量文件中識別合同或發(fā)票。在多類分類中,在數(shù)據(jù)集中有許多不同的類別,正在努力尋找最適合數(shù)據(jù)點的類別。例如,美國勞工統(tǒng)計局會對工傷進行自動分類。

·個性化。希望與客戶進行個性化交互或向客戶推薦產(chǎn)品和服務(wù)的組織首先需要將數(shù)據(jù)分組到具有共享特征的數(shù)據(jù)桶中。有效的數(shù)據(jù)科學(xué)工作可以使用推薦引擎和超個性化系統(tǒng)等技術(shù),根據(jù)個人的具體需求和喜好量身來定制網(wǎng)站,推銷產(chǎn)品及更多內(nèi)容,這些技術(shù)是通過匹配人員詳細資料中的數(shù)據(jù)來驅(qū)動的。

這只是數(shù)據(jù)科學(xué)應(yīng)用程序的一些示例。通過采用數(shù)據(jù)分析的各種工具和方法,數(shù)據(jù)科學(xué)家可以幫助使用它們的組織獲得戰(zhàn)略和競爭優(yōu)勢。
編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4840

    瀏覽量

    108145
  • 決策樹
    +關(guān)注

    關(guān)注

    3

    文章

    96

    瀏覽量

    14098
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    微電子科學(xué)家吳德馨院士逝世,在國內(nèi)率先提出利用MEMS結(jié)構(gòu)實現(xiàn)激光器和光纖的無源耦合

    3月24日,中國科學(xué)院微電子研究所官方賬號發(fā)布訃告,中國科學(xué)院院士,我國杰出的微電子科學(xué)家,中國科學(xué)院微電子
    的頭像 發(fā)表于 03-25 18:23 ?333次閱讀
    微電子<b class='flag-5'>科學(xué)家</b>吳德馨院士逝世,在國內(nèi)率先提出利用MEMS結(jié)構(gòu)實現(xiàn)激光器和光纖的無源耦合

    了解全國產(chǎn)轉(zhuǎn)速地磁測量模塊的應(yīng)用前景

    。在一些科研和工業(yè)應(yīng)用中,這類模塊的作用不可小覷。 你可能會問,為什么我們需要如此精密的測量工具?其實,地磁測量在地球科學(xué)、環(huán)境監(jiān)測、航天航空等領(lǐng)域都具有重要價值。比如,科學(xué)家們可以通過這些數(shù)據(jù)
    發(fā)表于 03-23 10:35

    中國科學(xué)家重大突破:智能手表未來有望靠體溫供電

    長久以來,“續(xù)航焦慮”困擾著可穿戴消費電子、植入式醫(yī)療領(lǐng)域。但現(xiàn)在,中國科學(xué)家的一項重磅研究,正在讓“人體自帶充電寶”從科幻走進現(xiàn)實——只需利用體溫與環(huán)境的微小溫差,就能為智能設(shè)備持續(xù)供電。2026
    的頭像 發(fā)表于 03-10 18:09 ?141次閱讀

    思必馳首席科學(xué)家俞凱教授當(dāng)選2026年度IEEE Fellow

    日前,全球最大的專業(yè)技術(shù)組織國際電氣電子工程師協(xié)會(The Institute of Electrical and Electronics Engineers, IEEE)公布了2026年度IEEE Fellow(會士)名單,上海交通大學(xué)特聘教授、思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家
    的頭像 發(fā)表于 12-12 11:36 ?967次閱讀

    中興通訊崔麗受邀出席2025騰沖科學(xué)家論壇

    近日,“2025騰沖科學(xué)家論壇”在云南啟幕。本屆論壇以“科學(xué)·AI改變世界”為主題,匯聚包括諾貝爾獎、圖靈獎、菲爾茲獎得主在內(nèi)的國際頂尖科學(xué)家,以及百余位兩院院士、高校校長、科技精英與產(chǎn)業(yè)領(lǐng)袖,共話
    的頭像 發(fā)表于 12-09 11:36 ?757次閱讀

    背散射衍射技術(shù)(EBSD)的應(yīng)用領(lǐng)域

    電子背散射衍射技術(shù)(EBSD)在材料科學(xué)研究中,對材料的顯微結(jié)構(gòu)和晶體學(xué)特性的深入理解是至關(guān)重要的。電子背散射衍射技術(shù)(EBSD)作為一種
    的頭像 發(fā)表于 11-26 17:13 ?946次閱讀
    背散射衍射<b class='flag-5'>技術(shù)</b>(EBSD)的應(yīng)用領(lǐng)域

    技術(shù)感知世界!昊衡科技在第四屆飛行器健康管理技術(shù)國際高端論壇暨青年科學(xué)家論壇等您!

    今日是第四屆飛行器健康管理技術(shù)國際高端論壇暨青年科學(xué)家論壇在廈門國際會展酒店(會展二路199號)的會議日,現(xiàn)場學(xué)術(shù)氛圍持續(xù)高漲。武漢昊衡科技作為國產(chǎn)先進光學(xué)測量與傳感測量儀器制造商,此次攜兩款創(chuàng)新
    的頭像 發(fā)表于 11-20 17:15 ?1801次閱讀
    <b class='flag-5'>技術(shù)</b>感知世界!昊衡科技在第四屆飛行器健康管理<b class='flag-5'>技術(shù)</b>國際高端論壇暨青年<b class='flag-5'>科學(xué)家</b>論壇等您!

    科學(xué)家利用微波激光照射鉆石,制造出時間準晶體

    科學(xué)家利用微波激光照射鉆石,制造出時間準晶體。 美國華盛頓大學(xué)、麻省理工學(xué)院和哈佛大學(xué)科學(xué)家攜手,成功在鉆石上“雕刻”出一種全新的物質(zhì)形態(tài):時間準晶體。這項突破有望為量子計算、精確計時等領(lǐng)域帶來
    的頭像 發(fā)表于 11-19 07:35 ?263次閱讀
    <b class='flag-5'>科學(xué)家</b>利用微波激光照射鉆石,制造出時間準晶體

    第四屆飛行器健康管理技術(shù)國際高端論壇暨青年科學(xué)家論壇:昊衡科技,歡迎您來!

    大會介紹第四屆飛行器健康管理技術(shù)國際高端論壇暨青年科學(xué)家論壇將于2025年11月19-21日在中國廈門舉行。會議由廈門大學(xué)和江南大學(xué)聯(lián)合主辦,圍繞飛行器健康管理與智能運維,以“數(shù)字時代、智領(lǐng)運維
    的頭像 發(fā)表于 11-14 17:36 ?3173次閱讀
    第四屆飛行器健康管理<b class='flag-5'>技術(shù)</b>國際高端論壇暨青年<b class='flag-5'>科學(xué)家</b>論壇:昊衡科技,歡迎您來!

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護科學(xué)

    損壞的風(fēng)險(所有浸入水中的技術(shù)設(shè)備都是如此),這意味著數(shù)據(jù)可能會在不知不覺中丟失,而基線數(shù)據(jù)集的后續(xù)缺口可能會妨礙科學(xué)家得出具有統(tǒng)計意義的可
    發(fā)表于 10-27 09:18

    國際類腦計算科學(xué)家Yulia Sandamirskaya教授加盟時識科技

    近日,國際類腦計算與神經(jīng)形態(tài)機器人領(lǐng)域知名科學(xué)家Yulia Sandamirskaya 教授,作為科學(xué)家顧問正式加入時識科技(SynSense)。
    的頭像 發(fā)表于 10-13 13:50 ?920次閱讀

    科技感拉滿!鯨啟智能機器人與無人機聯(lián)動,閃耀服務(wù)世界青年科學(xué)家論壇

    9 月 20 日,以 “青年,世界科學(xué)的未來” 為主題的世界青年科學(xué)家論壇(南京)在江北新區(qū)啟幕。20 余位諾貝爾獎得主、海內(nèi)外院士,超百位國際國內(nèi)青年科學(xué)家及產(chǎn)業(yè)代表齊聚,圍繞前沿科技展
    的頭像 發(fā)表于 10-11 16:54 ?436次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    靈感的過程中發(fā)揮關(guān)鍵作用。五、用AI實現(xiàn)諾貝爾獎級別的科學(xué)發(fā)現(xiàn) 這想法這能夠大膽的。 1、AI科學(xué)家的構(gòu)建 全自主科學(xué)實驗室需要哪些部分: ①自動實驗設(shè)備 ②流程管理系統(tǒng) ③數(shù)據(jù)處理和
    發(fā)表于 09-17 11:45

    復(fù)星醫(yī)藥使用亞馬遜云科技生成式AI技術(shù)賦能醫(yī)療撰寫場景 助力科學(xué)家效率躍升

    進程。通過“臨床試驗報告一致性檢查”和“研發(fā)文獻翻譯”兩大功能,復(fù)星醫(yī)藥可解放科學(xué)家生產(chǎn)力,使其專注于創(chuàng)新藥研發(fā)的核心工作。在亞馬遜云科技的加持下,“臨床試驗報告一致性檢查”可覆蓋研究人員90%的撰寫場景,工作效率提升70%;而在“研發(fā)文
    發(fā)表于 07-14 14:16 ?1187次閱讀

    地物光譜儀如何幫助科學(xué)家研究植被和土壤?

    在遙感、生態(tài)、農(nóng)業(yè)等研究領(lǐng)域,科學(xué)家們常常會提到一個工具: 地物光譜儀 。它看起來像一臺“測光的槍”,卻能揭示土壤和植被的“隱藏信息”。那么,地物光譜儀到底是怎么工作的?它又是如何在科學(xué)研究
    的頭像 發(fā)表于 05-20 15:46 ?771次閱讀
    地物光譜儀如何幫助<b class='flag-5'>科學(xué)家</b><b class='flag-5'>研究</b>植被和土壤?
    隆昌县| 光泽县| 邢台县| 苏尼特右旗| 叙永县| 沐川县| 屯昌县| 招远市| 莲花县| 蛟河市| 深州市| 紫阳县| 东源县| 延寿县| 桃园县| 兴宁市| 利辛县| 太保市| 马山县| 固阳县| 塔城市| 翁源县| 鄂伦春自治旗| 淮南市| 景宁| 武冈市| 黔东| 浦城县| 乃东县| 兰溪市| 师宗县| 休宁县| 阿坝县| 历史| 莲花县| 赫章县| 集安市| 宜州市| 江城| 克什克腾旗| 防城港市|