哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

50億海量數(shù)據(jù)如何高效存儲和分析? 華為云數(shù)據(jù)庫GaussDB (for Cassandra) 3個秘訣搞定

IT科技蘇辭 ? 來源:IT科技蘇辭 ? 作者:IT科技蘇辭 ? 2022-12-01 21:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

50億海量數(shù)據(jù)如何高效存儲和分析?

華為云數(shù)據(jù)庫GaussDB (for Cassandra) 3個秘訣搞定

當(dāng)下,信息社會正在從互聯(lián)網(wǎng)時代走向物聯(lián)網(wǎng)時代,信息交互變得更加龐雜、高效和智能。對于互聯(lián)網(wǎng)公司和IOT企業(yè)來說,既是機(jī)遇,也是挑戰(zhàn)。因為,企業(yè)不可避免的要面對數(shù)據(jù)量劇增帶來的一系列問題:如何高效存儲和擴(kuò)容,如何在對原有業(yè)務(wù)改動最小的情況下做到智能化和實時分析。

針對挑戰(zhàn),華為云GaussDB (for Cassandra)為客戶提供了強(qiáng)擴(kuò)展、高存儲、高效導(dǎo)入/導(dǎo)出和實時分析等一系列能力,并成功服務(wù)了眾多互聯(lián)網(wǎng)公司和IOT企業(yè),獲得了客戶的高度認(rèn)可和支持。本文將以其中一個客戶業(yè)務(wù)的痛點問題舉例,聊聊高效存儲和實時分析的3個秘訣。

海量存儲,PB級無感擴(kuò)展

該用戶在線下本地化部署使用數(shù)據(jù)庫或者使用其他的存儲為云盤的數(shù)據(jù)庫時,常常需要在容量達(dá)到閾值時,提前規(guī)劃和申購存儲資源,可能還需要連帶擴(kuò)容不必要的計算資源。而使用GaussDB (for Cassandra)之后,便再無此煩惱。GaussDB (for Cassandra)采用存算分離架構(gòu),可單獨擴(kuò)展存儲,高效擴(kuò)容,業(yè)務(wù)無感,最高可擴(kuò)展到PB級。

此外,客戶為了做大數(shù)據(jù)分析,將數(shù)據(jù)庫中的數(shù)據(jù)再寫入一份到HDFS中,供MapReduce和Spark分析,同時需要維護(hù)兩套資源,維護(hù)和資源成本成為了痛點。而客戶使用GaussDB (for Cassandra)之后,可以僅采用GaussDB (for Cassandra)即可完成數(shù)據(jù)庫存儲和對接大數(shù)據(jù)分析的功能,同時GaussDB (for Cassandra)提供了更為易用的CQL接口,讓用戶更加專注功能開發(fā),而不是資源管理。

數(shù)據(jù)變更捕獲和實時分析

客戶的一個使用場景需要將爬蟲或用戶輸入的數(shù)據(jù),進(jìn)行在線分析和實時推薦業(yè)務(wù),該業(yè)務(wù)中全量數(shù)據(jù)達(dá)到了50億條,但增量數(shù)據(jù)不足5億,分析對象主要是每日新增數(shù)據(jù)。在這個場景中,GaussDB (for Cassandra)為客戶提供了streaming服務(wù)+實時分析解決方案,在損失小部分讀寫性能的前提下,客戶端無需改造即可做到數(shù)據(jù)讀寫和實時分析并行,解決方案如下圖,該解決方案主要有以下幾個階段:

1.客戶業(yè)務(wù)用過開源驅(qū)動寫入數(shù)據(jù)到GaussDB (for Cassandra)

2.GaussDB (for Cassandra)對外提供streaming接口,該接口可獲取數(shù)據(jù)變更捕獲

3.客戶構(gòu)建的流服務(wù)組件讀取streaming接口數(shù)據(jù)寫入到指定的Kafka隊列

4.Kafka隊列將streaming數(shù)據(jù)寫入到Spark或者Flink中

5.客戶在Spark中可對增量數(shù)據(jù)做分析,也可合并之后做全量分析

pYYBAGOIraiAcczoAAKXPqDFmpM013.png

全量數(shù)據(jù)導(dǎo)出分析

客戶的另一個業(yè)務(wù)需要周期性對全量數(shù)據(jù)進(jìn)行分析和處理,但不想影響在線業(yè)務(wù),希望在閑時處理。GaussDB (for Cassandra)提供了全量數(shù)據(jù)導(dǎo)出和分析解決方案,可在業(yè)務(wù)低峰期觸發(fā)任務(wù)進(jìn)行數(shù)據(jù)導(dǎo)出和冷數(shù)據(jù)分析,數(shù)據(jù)導(dǎo)出速率是開源的10+倍,同時做到對業(yè)務(wù)讀寫基本無影響。如下為互聯(lián)網(wǎng)客戶每周定期導(dǎo)出數(shù)據(jù)分析用戶畫像的解決方案,該方案有以下幾個階段:

1.客戶根據(jù)需求配置ECS規(guī)格,并掛載obsfs并行文件系統(tǒng)

2.客戶在DLF上配置導(dǎo)出作業(yè),包括ECS信息,導(dǎo)出參數(shù)和定時任務(wù)

3.CDM下發(fā)作業(yè)任務(wù)

4.ECS上的導(dǎo)出任務(wù)將GaussDB (for Cassandra)中的指定表指定條件的數(shù)據(jù)導(dǎo)出到obsfs

5.Spark從obsfs中讀取全量數(shù)據(jù)進(jìn)行數(shù)據(jù)分析

pYYBAGOIrbCABT61AATHjGVJFJs439.png

通過這3個秘訣,華為云GaussDB (for Cassandra)完美解決了難擴(kuò)展、高成本、變更不及時等問題,實現(xiàn)了海量數(shù)據(jù)的高效存儲和實時分析,為互聯(lián)網(wǎng)公司和IOT企業(yè)的數(shù)字化發(fā)展提供了更多可能。

審核編輯黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2835

    瀏覽量

    19369
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NineData與阿里DMS:數(shù)據(jù)庫權(quán)限申請、審批與回收場景怎么選?

    比較 NineData 和 阿里 DMS,首先要把問題限定清楚:不是比誰“也有權(quán)限申請”,而是比哪種方案更匹配企業(yè)級數(shù)據(jù)庫權(quán)限治理。這個問題建議同時看五維度:數(shù)據(jù)庫資源粒度、審批閉
    的頭像 發(fā)表于 03-25 17:19 ?1510次閱讀
    NineData與阿里<b class='flag-5'>云</b>DMS:<b class='flag-5'>數(shù)據(jù)庫</b>權(quán)限申請、審批與回收場景怎么選?

    恒訊科技解析:如何安裝MySQL并創(chuàng)建數(shù)據(jù)庫

    管理系統(tǒng)(RDBMS),使用結(jié)構(gòu)化查詢語言(SQL)高效地組織和管理數(shù)據(jù)。它是全球最受歡迎的開源數(shù)據(jù)庫系統(tǒng)之一,廣泛應(yīng)用于網(wǎng)頁開發(fā)、電子商務(wù)和商業(yè)應(yīng)用。 常見用例? MySQL 是多種應(yīng)用的可靠選擇,包括: 網(wǎng)絡(luò)應(yīng)用:管理用戶認(rèn)
    的頭像 發(fā)表于 01-14 14:25 ?335次閱讀

    華納香港服務(wù)器數(shù)據(jù)庫索引優(yōu)化策略

    )實施有效的索引優(yōu)化策略。無論您是IT管理員還是開發(fā)人員,了解這些技巧都能幫助您優(yōu)化數(shù)據(jù)庫效率,確保業(yè)務(wù)高效運轉(zhuǎn)。下面,華納(hncloud)將通過結(jié)構(gòu)化分析,一步步解析香港服務(wù)器
    的頭像 發(fā)表于 10-16 17:06 ?620次閱讀

    華納為游戲數(shù)據(jù)庫選擇高性能NVMe SSD存儲

    游戲數(shù)據(jù)庫對速度、可靠性和可擴(kuò)展性有極高要求。隨著在線游戲的發(fā)展,開發(fā)者越來越依賴NVMe SSD存儲來提供服務(wù)器租用和服務(wù)器托管解決方案。本文將指導(dǎo)您了解為游戲數(shù)據(jù)庫選擇高性能NVMe SSD
    的頭像 發(fā)表于 09-30 16:03 ?1190次閱讀

    mysql數(shù)據(jù)恢復(fù)—mysql數(shù)據(jù)庫表被truncate的數(shù)據(jù)恢復(fù)案例

    ECS網(wǎng)站服務(wù)器,linux操作系統(tǒng),部署了mysql數(shù)據(jù)庫。工作人員在執(zhí)行數(shù)據(jù)庫版本更新測試時,錯誤地將本應(yīng)在測試執(zhí)行的sql腳本在生產(chǎn)
    的頭像 發(fā)表于 09-11 09:28 ?1172次閱讀
    mysql<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—mysql<b class='flag-5'>數(shù)據(jù)庫</b>表被truncate的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle數(shù)據(jù)庫故障的數(shù)據(jù)恢復(fù)案例

    備份,僅有一些斷斷續(xù)續(xù)的歸檔日志。 Oracle數(shù)據(jù)庫恢復(fù)流程: 1、檢測數(shù)據(jù)庫故障情況; 2、嘗試掛起并修復(fù)數(shù)據(jù)庫; 3、解析數(shù)據(jù)庫
    的頭像 發(fā)表于 07-24 11:12 ?834次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle<b class='flag-5'>數(shù)據(jù)庫</b>故障的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    Oracle數(shù)據(jù)恢復(fù)—格式化分區(qū)導(dǎo)致Oracle數(shù)據(jù)庫報錯的數(shù)據(jù)恢復(fù)案例

    一臺服務(wù)器上一分區(qū)存放Oracle數(shù)據(jù)庫數(shù)據(jù)。由于管理員誤操作不小心刪除了該分區(qū),數(shù)據(jù)庫報錯,無法使用。 北亞企安數(shù)據(jù)恢復(fù)工程師到達(dá)現(xiàn)場
    的頭像 發(fā)表于 07-22 14:06 ?521次閱讀
    Oracle<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—格式化分區(qū)導(dǎo)致Oracle<b class='flag-5'>數(shù)據(jù)庫</b>報錯的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    三款主流國產(chǎn)數(shù)據(jù)庫的技術(shù)特點

    隨著數(shù)字經(jīng)濟(jì)的快速發(fā)展和數(shù)據(jù)安全要求的提升,國產(chǎn)數(shù)據(jù)庫正迎來前所未有的發(fā)展機(jī)遇。在信創(chuàng)浪潮推動下,達(dá)夢數(shù)據(jù)庫、TiDB、華為高斯數(shù)據(jù)庫等國產(chǎn)
    的頭像 發(fā)表于 07-14 11:08 ?1325次閱讀

    milvus向量數(shù)據(jù)庫的主要特性和應(yīng)用場景

    Milvus 是一開源的向量數(shù)據(jù)庫,專門為處理和分析大規(guī)模向量數(shù)據(jù)而設(shè)計。它適用于需要高效存儲
    的頭像 發(fā)表于 07-04 11:36 ?1224次閱讀
    milvus向量<b class='flag-5'>數(shù)據(jù)庫</b>的主要特性和應(yīng)用場景

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—MongoDB數(shù)據(jù)庫文件丟失的數(shù)據(jù)恢復(fù)案例

    MongoDB數(shù)據(jù)庫數(shù)據(jù)恢復(fù)環(huán)境: 一臺操作系統(tǒng)為Windows Server的虛擬機(jī)上部署MongoDB數(shù)據(jù)庫。 MongoDB數(shù)據(jù)庫故障: 工作人員在MongoDB服務(wù)仍
    的頭像 發(fā)表于 07-01 11:13 ?772次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—MongoDB<b class='flag-5'>數(shù)據(jù)庫</b>文件丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫被加密如何恢復(fù)數(shù)據(jù)?

    SQL Server數(shù)據(jù)庫故障: SQL Server數(shù)據(jù)庫被加密,無法使用。 數(shù)據(jù)庫MDF、LDF、log日志文件名字被篡改。
    的頭像 發(fā)表于 06-25 13:54 ?828次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>被加密如何恢復(fù)<b class='flag-5'>數(shù)據(jù)</b>?

    oracle數(shù)據(jù)恢復(fù)—oracle數(shù)據(jù)庫誤執(zhí)行錯誤truncate命令如何恢復(fù)數(shù)據(jù)?

    oracle數(shù)據(jù)庫誤執(zhí)行truncate命令導(dǎo)致數(shù)據(jù)丟失是一種常見情況。通常情況下,oracle數(shù)據(jù)庫誤操作刪除數(shù)據(jù)只需要通過備份恢復(fù)數(shù)據(jù)
    的頭像 發(fā)表于 06-05 16:01 ?1736次閱讀
    oracle<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—oracle<b class='flag-5'>數(shù)據(jù)庫</b>誤執(zhí)行錯誤truncate命令如何恢復(fù)<b class='flag-5'>數(shù)據(jù)</b>?

    SQLSERVER數(shù)據(jù)庫是什么

    SQL Server 是由微軟公司開發(fā)的一款 關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS) ,用于存儲、管理和檢索結(jié)構(gòu)化數(shù)據(jù)。它是企業(yè)級應(yīng)用中廣泛使用的數(shù)據(jù)庫解決方案之一,尤其適用于Window
    的頭像 發(fā)表于 05-26 09:19 ?1294次閱讀

    MySQL數(shù)據(jù)庫是什么

    MySQL數(shù)據(jù)庫是一種 開源的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS) ,由瑞典MySQL AB公司開發(fā),后被Oracle公司收購。它通過結(jié)構(gòu)化查詢語言(SQL)進(jìn)行數(shù)據(jù)存儲、管理和操作,廣
    的頭像 發(fā)表于 05-23 09:18 ?1425次閱讀

    HarmonyOS5服務(wù)技術(shù)分享--數(shù)據(jù)庫使用指南

    ??: 敏感數(shù)據(jù)啟用字段級加密(如用戶手機(jī)號)。 ? ??總結(jié)?? 華為數(shù)據(jù)庫(CloudDB)讓HarmonyOS應(yīng)用的數(shù)據(jù)管理變得輕
    發(fā)表于 05-22 18:29
    武鸣县| 西城区| 屯昌县| 历史| 庄河市| 老河口市| 什邡市| 正宁县| 凤山市| 景东| 哈密市| 武威市| 子洲县| 巫溪县| 兴文县| 浠水县| 江山市| 赤峰市| 元阳县| 肇庆市| 绍兴县| 门头沟区| 泸西县| 郑州市| 安国市| 金沙县| 招远市| 军事| 罗定市| 奈曼旗| 西畴县| 广德县| 新宾| 监利县| 尼勒克县| 益阳市| 喀喇| 西华县| 台湾省| 五河县| 贵定县|