![]() ![]() |
Hive數(shù)據(jù)倉庫應用教程
本書將Hive相關(guān)技術(shù)分為9個項目,對Hive數(shù)據(jù)倉庫的應用進行了詳細的描述。項目一認識Hive,主要介紹數(shù)據(jù)倉庫的概念、特點、模型、體系結(jié)構(gòu),以及Hive的概念、體系結(jié)構(gòu)、數(shù)據(jù)類型等內(nèi)容。項目二Hive環(huán)境搭建,主要介紹搭建Hive的過程,包括虛擬機軟件工具的使用方法;Linux鏡像文件的安裝、克隆、啟動;Linux中的網(wǎng)絡(luò)環(huán)境設(shè)置;Hadoop環(huán)境的搭建;Hive的搭建等內(nèi)容。項目三Hive基本語法,主要介紹了Hive的常用數(shù)據(jù)類型、運算符與表達式、Hive的數(shù)據(jù)存儲方式、常用的交互命令和其他操作命令。項目四Hive數(shù)據(jù)定義,主要介紹數(shù)據(jù)庫、數(shù)據(jù)表、分區(qū)表、分桶表、視圖、索引的創(chuàng)建、查看、修改和刪除等操作。項目五數(shù)據(jù)的導入與導出,主要介紹通過直接加載、Load加載、查詢加載、Import加載等方式導入數(shù)據(jù),以及通過Insert命令、Hadoop命令、HiveShell命令等方式導出數(shù)據(jù)的方法。項目六Hive數(shù)據(jù)查詢,主要介紹Hive數(shù)據(jù)庫的基本查詢、條件查詢、分組、連接、排序等語句,以及隨機抽樣查詢等操作。項目七Hive函數(shù),主要介紹了內(nèi)置函數(shù)的應用,包括算術(shù)函數(shù)、聚合函數(shù)、日期時間函數(shù)、條件函數(shù)以及字符串函數(shù),Hive其他常見函數(shù)以及自定義函數(shù)的應用。項目八Hive優(yōu)化,主要介紹了本地模式、配MapReduce壓縮、配置Map和Reduce個數(shù)、合并小文件、聚合語句、連接語句、統(tǒng)計語句、行/列過濾等優(yōu)化方式。項目九綜合案例,通過對電商銷售大數(shù)據(jù)的分析,綜合應用前述所學知識完成Hive數(shù)據(jù)倉庫的建庫建表,已經(jīng)完成各類電商數(shù)據(jù)的統(tǒng)計分析。
你還可能感興趣
我要評論
|