柚子快報邀請碼778899分享:數(shù)據(jù)倉庫 數(shù)倉(DW)的架構(gòu)
柚子快報邀請碼778899分享:數(shù)據(jù)倉庫 數(shù)倉(DW)的架構(gòu)
文章目錄
事實表分:事務型事實表,周期性快照事實表,累計快照事實表
維度表維度表設計方法
星型模型和OLAP多維數(shù)據(jù)庫Kimball的數(shù)倉架構(gòu)獨立數(shù)據(jù)集市架構(gòu)輻射狀企業(yè)信息工廠Inmon架構(gòu)混合架構(gòu)
事實表
每行數(shù)據(jù)對應的是一個粒度的事件。 例子:訂單表中的一條數(shù)據(jù)是:一個訂單code,其他的訂單信息。訂單細表中的一條數(shù)據(jù)是:一個訂單code,多個子訂單code,其他的訂單信息
分:事務型事實表,周期性快照事實表,累計快照事實表
事務事實表的一行對應空間或時間上某點的度量事件,最細粒度的數(shù)據(jù) 周期快照事實表中的每行匯總了發(fā)生在某 一標準周期 ,如某一天 、某周 、某月的多個 度量事件 。粒度是周期性的 ,而不是個體的事務 。周期快照事實表通常包含許多事實,因為任何與事實表粒度 一致的度量事件都是被允許存在的 累積快照事實表的行匯總了發(fā)生在過程開始和結(jié)束之間可預測步驟內(nèi)的度量事件。 累計快照適用于較短周期,有著明確的開始和結(jié)束狀態(tài)的過程,如一個訂單執(zhí)行的過程,并記錄過程中每個步驟的執(zhí)行時間,使分析人員對執(zhí)行的過程有整體的把握。周期快照事實表記錄上每個步驟的執(zhí)行時間是逐步建立的,隨著執(zhí)行的過程逐步更新的事實表中。
維度表
趨向于少行多列。每個維度表都由單一的主鍵定義,用于與事實表關聯(lián)
維度表設計方法
第一步:選擇維度或新建維度。作為維度建模的核心,在企業(yè)級數(shù)據(jù)倉庫中必須保證維度的唯一性。 第二步:確定主維表。此處的主維表一般是 ODS 表,直接從業(yè)務系統(tǒng)同步而來。例子:訂單表中的數(shù)據(jù) 第三步:確定相關維表。數(shù)據(jù)倉庫是業(yè)務源系統(tǒng)的數(shù)據(jù)整合,不同業(yè)務系統(tǒng)或者同一業(yè)務系統(tǒng)中的表之間存在關聯(lián)性。 第四步:確定維度屬性。第一 :從主維表中選擇維度屬性或生成新的維度屬性;第二:從相關維表中選擇維度屬性或生成新的維度屬性。
星型模型和OLAP多維數(shù)據(jù)庫
星型模型:在關系型數(shù)據(jù)庫中實現(xiàn)的維度模型。當所有的維度表都是和事實表直接相連 OLAP(聯(lián)機分析處理)多維數(shù)據(jù)庫:在多維數(shù)據(jù)庫環(huán)境中實現(xiàn)的維度模型 雪花模型:有多個維度表沒有直接和事實表相連,而是通過其它的維度表,間接的連接在事實表上 星座模型:星型模型的擴展。有多張事實表,不同事實表之前共享維度表 OLTP(聯(lián)機事務處理):傳統(tǒng)的關系型數(shù)據(jù)庫,基本日常的事務處理,數(shù)據(jù)量不大,但是實時性要求高
Kimball的數(shù)倉架構(gòu)
源系統(tǒng)的數(shù)據(jù),經(jīng)過ETL(獲取,轉(zhuǎn)換,加載)[Extract Transformation and Load],按照業(yè)務線建立最小粒度的事實表,再建立維表,形成數(shù)據(jù)集市,搭建數(shù)倉
獨立數(shù)據(jù)集市架構(gòu)
集團的各個子公司或是公司的各個大部門之間大多會使用這種架構(gòu)。 可以快速的搭建完成,成本較低。但是各個部門之間的數(shù)據(jù)不一致可能會造成結(jié)論不一樣,導致新問題的產(chǎn)生
輻射狀企業(yè)信息工廠Inmon架構(gòu)
是自上而下按照主題建立數(shù)倉,如crm,kcrm,ehr,oa等建立不同的主題。新開發(fā)主題就繼續(xù)增加
混合架構(gòu)
柚子快報邀請碼778899分享:數(shù)據(jù)倉庫 數(shù)倉(DW)的架構(gòu)
參考鏈接
本文內(nèi)容根據(jù)網(wǎng)絡資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點和立場。
轉(zhuǎn)載請注明,如有侵權,聯(lián)系刪除。