柚子快報(bào)邀請(qǐng)碼778899分享:大數(shù)據(jù) 數(shù)據(jù)倉(cāng)庫(kù)是什么
柚子快報(bào)邀請(qǐng)碼778899分享:大數(shù)據(jù) 數(shù)據(jù)倉(cāng)庫(kù)是什么
寫在前面
剛接觸大數(shù)據(jù)的新手小白可能會(huì)對(duì)數(shù)據(jù)倉(cāng)庫(kù)這個(gè)詞比較陌生,本文將介紹數(shù)據(jù)倉(cāng)庫(kù)的主要特征及OLTP&OLAP的區(qū)別,幫助讀者更好理解數(shù)據(jù)倉(cāng)庫(kù)。
一、什么是數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)倉(cāng)庫(kù),簡(jiǎn)稱數(shù)倉(cāng),是一個(gè)對(duì)數(shù)據(jù)進(jìn)行加工,集成,計(jì)算,并最終用于存儲(chǔ)、分析、報(bào)告的數(shù)據(jù)系統(tǒng)。
數(shù)據(jù)倉(cāng)庫(kù)接收來(lái)自各個(gè)外部系統(tǒng)的數(shù)據(jù),加工處理后,提供給各個(gè)外部應(yīng)用使用。從數(shù)據(jù)流向上看,數(shù)據(jù)在業(yè)務(wù)系統(tǒng)產(chǎn)生,流轉(zhuǎn)到數(shù)據(jù)倉(cāng)庫(kù),進(jìn)行處理后,流向各個(gè)數(shù)據(jù)使用方。
二、數(shù)據(jù)倉(cāng)庫(kù)的主要特征
數(shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的、穩(wěn)定的,反映歷史變化的數(shù)據(jù)集合,用以支持管理決策。
2.1 面向主題的
業(yè)務(wù)系統(tǒng)更加關(guān)注面向業(yè)務(wù)過(guò)程的事務(wù)處理(OLTP),并且不同業(yè)務(wù)系統(tǒng)之間可能是相互隔離的,與業(yè)務(wù)系統(tǒng)不同的是,數(shù)據(jù)倉(cāng)庫(kù)關(guān)注面向主題的數(shù)據(jù)分析,在數(shù)倉(cāng)中,數(shù)據(jù)是按照不同的主題區(qū)分的。主題是一個(gè)相對(duì)抽象的概念,是在一個(gè)較高的層面對(duì)企業(yè)級(jí)數(shù)據(jù)綜合,歸類并加以分析的抽象體,它對(duì)應(yīng)的是企業(yè)中某一具體分析領(lǐng)域中所涉及的分析對(duì)象。
2.2 集成的
各個(gè)業(yè)務(wù)系統(tǒng)之間可能是相互隔離的,數(shù)據(jù)彼此分散,獨(dú)立,異構(gòu),當(dāng)需要分析一個(gè)主題的數(shù)據(jù)而該主題數(shù)據(jù)又分散在不同的業(yè)務(wù)系統(tǒng)中時(shí),對(duì)數(shù)據(jù)進(jìn)行集成就很有必要了,集成是將各個(gè)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)進(jìn)行抽取、清洗、轉(zhuǎn)換和匯總,這是數(shù)據(jù)倉(cāng)庫(kù)建設(shè)中最關(guān)鍵,最重要,最復(fù)雜的一個(gè)環(huán)節(jié)
2.3 穩(wěn)定的
數(shù)據(jù)一旦進(jìn)入數(shù)據(jù)倉(cāng)庫(kù),它便穩(wěn)定且不會(huì)改變,每次相同條件的查詢結(jié)果都是一致的。在數(shù)據(jù)倉(cāng)庫(kù)中,對(duì)數(shù)據(jù)進(jìn)行的操作主要是查詢,目的是對(duì)數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)數(shù)據(jù)中的規(guī)律,像修改和刪除這種操作是很少的,并且進(jìn)入到數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)一般會(huì)保留比較長(zhǎng)的時(shí)間。
2.4 反映歷史變化的
數(shù)據(jù)倉(cāng)庫(kù)包含各種粒度的歷史數(shù)據(jù),這些數(shù)據(jù)可能與日期、月份、季度或者年份等時(shí)間屬性。
與業(yè)務(wù)系統(tǒng)只關(guān)系數(shù)據(jù)當(dāng)前狀態(tài)不同,數(shù)據(jù)倉(cāng)庫(kù)側(cè)重點(diǎn)是分析,因此,它在關(guān)注數(shù)據(jù)當(dāng)前狀態(tài)的同時(shí)也會(huì)關(guān)注數(shù)據(jù)的歷史狀態(tài)。
數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)隨時(shí)間而變化主要體現(xiàn)在以下幾個(gè)方面: (1)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)時(shí)限一般要遠(yuǎn)遠(yuǎn)長(zhǎng)于操作型數(shù)據(jù)的數(shù)據(jù)時(shí)限。 (2)操作型系統(tǒng)存儲(chǔ)的是當(dāng)前數(shù)據(jù),而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是歷史數(shù)據(jù)。 (3)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是按照時(shí)間順序追加的,它們都帶有時(shí)間屬性。
三、OLTP與OLAP
OLTP
聯(lián)機(jī)事務(wù)處理(On-Line Transaction Processing)
重點(diǎn)在事務(wù)處理,針對(duì)業(yè)務(wù)系統(tǒng)中的具體業(yè)務(wù)在數(shù)據(jù)庫(kù)中的日常操作,一般是對(duì)少數(shù)記錄進(jìn)行查詢,修改,更新。用戶更關(guān)心的是操作的響應(yīng)時(shí)間、數(shù)據(jù)安全、完整和支持并發(fā)等生產(chǎn)安全相關(guān)的問(wèn)題。RDBMS是OLTP系統(tǒng)的典型應(yīng)用,即是我們俗稱的數(shù)據(jù)庫(kù),當(dāng)然這里強(qiáng)調(diào)的是關(guān)系型數(shù)據(jù)庫(kù)如MySQL。
OLAP
聯(lián)機(jī)分析處理(On-Line Analytical Processing)
重點(diǎn)在于分析,這類主要是對(duì)數(shù)據(jù)進(jìn)行集成,匯總,并通過(guò)復(fù)雜多維度的處理分析,以達(dá)到支持管理決策的目的。
現(xiàn)代OLAP系統(tǒng)一般以數(shù)據(jù)倉(cāng)庫(kù)作為基礎(chǔ),即從數(shù)據(jù)倉(cāng)庫(kù)中抽取詳細(xì)數(shù)據(jù)的一個(gè)子集并經(jīng)過(guò)必要的聚集存儲(chǔ)到OLAP存儲(chǔ)器中供前端分析工具讀取,在多維度的分析中,發(fā)現(xiàn)數(shù)據(jù)中的規(guī)律。
總結(jié)
實(shí)際上OLTP和OLAP是兩種處理數(shù)據(jù)的方式,他們各有優(yōu)劣,各有側(cè)重點(diǎn)。而OLAP作為數(shù)據(jù)倉(cāng)庫(kù)的主要應(yīng)用,在企業(yè)管理決策中發(fā)揮著越來(lái)越重要的作用。
柚子快報(bào)邀請(qǐng)碼778899分享:大數(shù)據(jù) 數(shù)據(jù)倉(cāng)庫(kù)是什么
相關(guān)閱讀
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。
轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。