柚子快報(bào)激活碼778899分享:Hadoop Hbase
柚子快報(bào)激活碼778899分享:Hadoop Hbase
0目錄
1.Hbase安裝 2.表操作 3.hbase原理
1. Hbase安裝
1.1? 安裝zookeeper 下載解壓zookeeper和hbase到soft目錄 1.2? 安裝hbase 配置環(huán)境變量? vim /etc/profile #ZK export ZOOKEEPER_HOME=/opt/soft/zk345 export PATH=$ZOOKEEPER_HOME/bin:$PATH #HBASE_HOME export HBASE_HOME=/opt/soft/hbase235 export PATH=$HBASE_HOME/bin:$PATH hbase235/conf目錄下的 編輯hbase-env.sh:[root@kb129 conf]# vim ./hbase-env.sh export JAVA_HOME=/opt/soft/jdk180 編輯hbase-site.xml [root@kb129 conf]# vim ./hbase-site.xml
2.表操作
添加數(shù)據(jù) 根據(jù)rowkey獲取列族和列 獲取列族中的單個(gè)列信息
3.補(bǔ)充Hbase原理
HBase定義 HBase是一種分布式、可擴(kuò)展、支持海量數(shù)據(jù)存儲(chǔ)的NoSQL數(shù)據(jù)庫(kù)。 HBase數(shù)據(jù)模型 邏輯上,HBase的數(shù)據(jù)模型同關(guān)系型數(shù)據(jù)庫(kù)很類似,數(shù)據(jù)存儲(chǔ)在一張表中,有行有列。但從HBase的底層物理存儲(chǔ)結(jié)構(gòu)(K-V)來(lái)看,HBase更像是一個(gè)multi-dimensional map(多維地圖)。 HBase物理存儲(chǔ)結(jié)構(gòu) 數(shù)據(jù)模型 1)Name Space 命名空間,類似于關(guān)系型數(shù)據(jù)庫(kù)的database概念,每個(gè)命名空間下有多個(gè)表。HBase兩個(gè)自帶的命名空間,分別是hbase和default,hbase中存放的是HBase內(nèi)置的表,default表是用戶默認(rèn)使用的命名空間。 2)Table 類似于關(guān)系型數(shù)據(jù)庫(kù)的表概念。不同的是,HBase定義表時(shí)只需要聲明列族即可,不需要聲明具體的列。這意味著,往HBase寫入數(shù)據(jù)時(shí),字段可以動(dòng)態(tài)、按需指定。因此,和關(guān)系型數(shù)據(jù)庫(kù)相比,HBase能夠輕松應(yīng)對(duì)字段變更的場(chǎng)景。 3)Row HBase表中的每行數(shù)據(jù)都由一個(gè)RowKey和多個(gè)Column(列)組成,數(shù)據(jù)是按照RowKey的字典順序存儲(chǔ)的,并且查詢數(shù)據(jù)時(shí)只能根據(jù)RowKey進(jìn)行檢索,所以RowKey的設(shè)計(jì)十分重要。 4)Column HBase中的每個(gè)列都由Column Family(列族)和Column Qualifier(列限定符)進(jìn)行限定,例如info:name,info:age。建表時(shí),只需指明列族,而列限定符無(wú)需預(yù)先定義。 5)Time Stamp 用于標(biāo)識(shí)數(shù)據(jù)的不同版本(version),每條數(shù)據(jù)寫入時(shí),系統(tǒng)會(huì)自動(dòng)為其加上該字段,其值為寫入HBase的時(shí)間。 6)Cell 由{rowkey, column Family:column Qualifier, time Stamp} 唯一確定的單元。cell中的數(shù)據(jù)全部是字節(jié)碼形式存貯。 HBase基本架構(gòu) 架構(gòu)角色: 1)Region Server Region Server為 Region的管理者,其實(shí)現(xiàn)類為HRegionServer,主要作用如下: 對(duì)于數(shù)據(jù)的操作:get, put, delete; 對(duì)于Region的操作:splitRegion、compactRegion。 2)Master Master是所有Region Server的管理者,其實(shí)現(xiàn)類為HMaster,主要作用如下: ??? 對(duì)于表的操作:create, delete, alter 對(duì)于RegionServer的操作:分配regions到每個(gè)RegionServer,監(jiān)控每個(gè)RegionServer的狀態(tài),負(fù)載均衡和故障轉(zhuǎn)移。 3)Zookeeper HBase通過(guò)Zookeeper來(lái)做master的高可用、RegionServer的監(jiān)控、元數(shù)據(jù)的入口以及集群配置的維護(hù)等工作。 4)HDFS HDFS為Hbase提供最終的底層數(shù)據(jù)存儲(chǔ)服務(wù),同時(shí)為HBase提供高容錯(cuò)的支持。 Hive映射Hbase Kb23:kb23factory表2個(gè)列族 列和具體信息 建立映射
柚子快報(bào)激活碼778899分享:Hadoop Hbase
推薦閱讀
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。
轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。