火山引擎ByteHouse上線ELT能力,進(jìn)一步降低企業(yè)數(shù)字化維護(hù)成本
(資料圖片)
在數(shù)據(jù)分析場(chǎng)景中,企業(yè)使用的數(shù)據(jù)通常具備來源多樣化的特點(diǎn),如支付交易記錄、用戶行為等,且數(shù)據(jù)格式各異,有的為行式存儲(chǔ)結(jié)構(gòu),有的為列式存儲(chǔ)結(jié)構(gòu)。這就要求企業(yè)數(shù)倉具備一定的數(shù)據(jù)轉(zhuǎn)換能力。
傳統(tǒng)方式是采用Extract-Transform-Load (ETL)來將業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為適合數(shù)倉的數(shù)據(jù)模型,然而,這依賴于獨(dú)立于數(shù)倉外的ETL系統(tǒng),導(dǎo)致維護(hù)成本較高。但隨著云計(jì)算時(shí)代的到來,云數(shù)據(jù)倉庫具備更強(qiáng)擴(kuò)展性和計(jì)算能力,也要求改變傳統(tǒng)的ELT流程。
火山引擎ByteHouse是一款基于開源ClickHouse推出的云原生數(shù)據(jù)倉庫,為用戶提供極速分析體驗(yàn),能夠支撐實(shí)時(shí)數(shù)據(jù)分析和海量數(shù)據(jù)離線分析,同時(shí)還具備便捷的彈性擴(kuò)縮容能力,極致分析性能和豐富的企業(yè)級(jí)特性。憑借其強(qiáng)大的計(jì)算能力,火山引擎ByteHouse目前已全面支持Extract-Load-Transform (ELT)的能力,讓用戶免于維護(hù)多套異構(gòu)系統(tǒng),產(chǎn)品易用性實(shí)現(xiàn)飛躍。
通過ByteHouse的ELT能力,用戶只需將數(shù)據(jù)導(dǎo)入,用自定義SQL語句在ByteHouse內(nèi)部進(jìn)行數(shù)據(jù)轉(zhuǎn)換,無需依賴獨(dú)立的ETL系統(tǒng)及資源。具體來說,ByteHouse主要通過以下三個(gè)能力實(shí)現(xiàn)ELT能力:
首先,長任務(wù)管理。ByteHouse的查詢時(shí)間為秒級(jí),一旦查詢中出故障,系統(tǒng)會(huì)直接返回錯(cuò)誤并重試。在ETL場(chǎng)景下,如果一個(gè)任務(wù)已經(jīng)執(zhí)行50分鐘才發(fā)生故障,重試意味著浪費(fèi)了前50分鐘的資源,影響任務(wù)推進(jìn)。在ByteHouse中,SQL查詢會(huì)被轉(zhuǎn)化為一系列的算子,研發(fā)團(tuán)隊(duì)則通過提升算子的容錯(cuò)能力,來應(yīng)對(duì)長時(shí)間查詢下的系統(tǒng)故障問題,即當(dāng)某個(gè)算子無法獲得足夠的內(nèi)存時(shí),系統(tǒng)允許該算子將一部分?jǐn)?shù)據(jù)緩存在磁盤上,保證在資源緊張的情況下仍能夠完成工作。
其次,異步提交能力。面對(duì)大量長耗時(shí)的ETL任務(wù)時(shí),傳統(tǒng)的同步執(zhí)行方式需要客戶端等待服務(wù)端返回,容易出現(xiàn)超時(shí)問題,影響后續(xù)任務(wù)執(zhí)行,而ByteHouse提供的異步提交能力,通過客戶端的間歇性輪訓(xùn)來獲得用戶任務(wù)的最終狀態(tài),由此保障任務(wù)在規(guī)定時(shí)間內(nèi)完成。
最后,查詢隊(duì)列。當(dāng)面臨大量離線加工請(qǐng)求時(shí),系統(tǒng)會(huì)出現(xiàn)超載。ByteHouse為此提供了查詢隊(duì)列能力,允許用戶從隊(duì)列大小、總CPU占用率、總內(nèi)存占用率三個(gè)維度定義一個(gè)隊(duì)列。
具體來說,當(dāng)用戶向某隊(duì)列提交查詢時(shí),ByteHouse可以通過組件監(jiān)聽各個(gè)隊(duì)列中的查詢指標(biāo),如果隊(duì)列未達(dá)到上限,則會(huì)將查詢?nèi)腙?duì),否則拒絕。除此之外,ByteHouse還會(huì)檢查隊(duì)列的資源利用率,當(dāng)空閑資源高過某閾值時(shí),自動(dòng)將等待中的查詢出隊(duì)。利用查詢隊(duì)列,用戶在編排ETL任務(wù)時(shí)無需擔(dān)心底層資源過載,讓開發(fā)更加便捷。
長任務(wù)管理、異步提交和查詢隊(duì)列是火山引擎ByteHouse ELT的核心能力。未來,ByteHouse也會(huì)進(jìn)一步迭代,支持轉(zhuǎn)換函數(shù)、長任務(wù)容錯(cuò)、優(yōu)先級(jí)隊(duì)列等更豐富ELT功能,為用戶提供更極致、更便捷的使用體驗(yàn)。(作者:何雅逸)
關(guān)鍵詞:
[責(zé)任編輯:xwzkw]
相關(guān)閱讀
- (2023-09-08)火山引擎ByteHouse上線ELT能力,進(jìn)一步降低企業(yè)數(shù)字化維護(hù)成本
- (2023-09-08)大湖股份09月08日主力大幅流出
- (2023-09-08)(長江云)咸安:夏日云彩大賞
- (2023-09-08)杭州亞運(yùn)會(huì)火炬?zhèn)鬟f啟動(dòng)
- (2023-09-08)Q2全球手機(jī)市場(chǎng)第一雖是蘋果但下滑明顯,反倒不少國產(chǎn)品牌出現(xiàn)了大幅度增長
- (2023-09-08)諸葛亮治國思想有哪些,是如何實(shí)踐的,有何啟示?
- (2023-09-08)業(yè)績預(yù)告披露的預(yù)計(jì)凈利潤與經(jīng)審計(jì)凈利潤差異較大 ST易購收深交所監(jiān)管函
- (2023-09-08)泰豪科技:獨(dú)立董事李世剛因工作調(diào)整辭職
- (2023-09-08)證券板塊漲0.41% 華西證券漲3.44%居首
- (2023-09-08)C12-14酸甲酯商品報(bào)價(jià)動(dòng)態(tài)(2023-09-08)
- (2023-09-08)辛癸醇商品報(bào)價(jià)動(dòng)態(tài)(2023-09-08)
- (2023-09-08)C16酸甲酯商品報(bào)價(jià)動(dòng)態(tài)(2023-09-08)
- (2023-09-08)十八醇商品報(bào)價(jià)動(dòng)態(tài)(2023-09-08)
- (2023-09-08)重拳出擊!清華近兩萬名留學(xué)生拒絕回國,國家竟做出驚人舉措…
- (2023-09-08)秀肌肉!首批4只科創(chuàng)100ETF吸金70億|ETF深觀察
- (2023-09-08)美亞光電(002690.SZ):財(cái)務(wù)總監(jiān)變更為陳凱
- (2023-09-08)2023年09月日歷(2023年09月08日stheitisc medium字體下載)
- (2023-09-08)杭州第19屆亞運(yùn)會(huì)火炬?zhèn)鬟f啟動(dòng)
- (2023-09-08)山西路橋第三工程有限公司承建的昔榆高速LJ6標(biāo)高峪咀隧道斜井至出口段全幅順利貫通
- (2023-09-08)命運(yùn)轉(zhuǎn)變之道——九大轉(zhuǎn)變的國學(xué)智慧
- (2023-09-08)居庸關(guān)長城景區(qū)夜長城及部分區(qū)域暫時(shí)關(guān)閉
- (2023-09-08)連宿高速公路沭陽至宿豫段全線已進(jìn)入收尾階段
- (2023-09-08)9.8:周五下午,A股怎么走?
- (2023-09-08)達(dá)娃央宗領(lǐng)銜 中國亞運(yùn)三代采火使者“云”同框
- (2023-09-08)最真的友情,都在千年前的詩里
- (2023-09-08)仙壇股份:8月雞肉產(chǎn)品銷售收入4.74億元 環(huán)比下降10.62%
- (2023-09-08)化學(xué)方程式怎么配平(化學(xué)方程式配平的方法)
- (2023-09-08)迄今為止 iPhone 的 5 個(gè)最大里程碑
- (2023-09-08)硬核技巧:Power BI 切片器里加圖標(biāo)
- (2023-09-08)融360:各類存款利率均持續(xù)走低 股份制銀行下調(diào)較多