華為大數據 HCIE-Big Data課程介紹
HCIE-Big Data認證定位于大數據分析領域中大型分布式并行處理數據倉庫平臺的架構原理、優化設計、應用開發和大數據挖掘領域的基礎理論、常用挖掘算法、應用設計以及開發,旨在推動業界大數據行業的專家型人才培養。
HCIE-Big Data認證包括但不僅限于:(1)華為企業級的大型并行處理分布式數據倉庫平臺FusionInsight LibrA的架構、功能特性、數據庫設計、數據庫數據導入導出、數據庫調優及數據庫開發等;(2)數據挖掘的理論(包括數據預處理、數據倉庫、分類、聚類、關聯規則等)以及使用華為企業級大數據挖掘平臺FusionInsight Miner和基于華為云的企業智能平臺EI (Enterprise Intelligence)的基礎服務 - MLS (Machine Learning Service,機器學習服務)進行數據深度分析和挖掘。
通過HCIE-Big Data認證,將證明您系統理解并掌握大型并行處理數據倉庫平臺的架構原理、分布式關系型數據庫的設計和優化及應用開發;掌握大數據挖掘的基本原理,常用算法、常用挖掘方法、對華為大數據挖掘解決方案FusionInsight Miner和華為云機器學習服務MLS的熟練使用,勝任數據倉庫開發、大數據分析、大數據數據挖掘和人工智能的相關崗位。
企業擁有HCIE-Big Data 認證的工程師,意味著企業掌握了運用大數據技術進行大數據分析應用、大數據挖掘應用的能力。
大數據知識點:
一章 數據倉庫平臺FusionInsight LibrA(理論)
第 一節 分布式數據庫架構
體系架構基本知識
熟悉MPP架構及優勢
業界產品說明
第二節 FusionInsight LibrA 基本組件簡介
LibrA邏輯架構
LibrA物理架構
LibrA數據庫對象
第三節 FusionInsight LibrA 產品特性和關鍵技術
架構和支持的操作系統
面向應用開發的基本功能
數據庫安全
圖形化工具
高級特性
第四節 FusionInsight LibrA 配套工具集
Database Manager概念與架構
Database Manager的安裝
Database Manager的使用
Data Studio概念與架構
Data Studio的安裝與FusionInsight LibrA服務器的配置
Data Studio工具支持的特性
Data Studio的使用
第五節 FusionInsight LibrA 安全管理
訪問控制
用戶管理
權限管理模型
對象權限
安全審計
第六節 FusionInsight LibrA 數據庫管理系統并發控制
配置負載均衡
事務與隔離
LibrA鎖機制介紹
第七節 FusionInsight LibrA 數據庫性能監控
系統資源監控方式
性能相關視圖
使用命令行監控集群性能
使用DM工具監控集群性能
第八節 FusionInsight LibrA 數據遷移
數據遷移場景劃分
GDS工具適用場景和使用方法
Copy from/to適用場景和使用方法
開源ELT工具適用場景和使用方法
gs_dump/gs_restore適用場景和使用方法
gsql工具適用場景和使用方法
Roach工具適用場景和使用方法
從其他數據庫中遷移數據
第九節 FusionInsight LibrA SQL介紹
SQL相關機制和原理
利用EXPLAIN進行SQL調優
第十節 FusionInsight LibrA 數據庫設計
數據庫邏輯設計
存儲模式
數據分布
表分區
索引
第十一節 FusionInsight LibrA 應用程序開發指導
FusionInsight LibrA驅動介紹
ODBC應用程序開發
JDBC應用程序開發
基礎開發規范
第二章 FusionInsight LibrA(實驗)
FusionInsight LibrA基本操作、語法
FusionInsight LibrA性能優化
網絡KPI數據柵格化處理
重點區域數據分析
流動人口常駐地分析
第三章 大數據挖掘理論
第一節 預備知識和數據介紹
數據挖掘的定義
數據挖掘的流程
數據挖掘的應用
數據和屬性類型
數據的統計描述
數據的鄰近性度量
第二節 數據預處理
為什么要預處理數據
數據清理
數據集成
數據歸約
數據變換
第三節 數據倉庫介紹
數據倉庫的概念
數據倉庫的體系結構與模型
多維數據模型
概念分層
OLAP與OLTP
方體物化
第四節 分類
分類和回歸的概念
決策樹分類
樸素貝葉斯分類
組合分類
后向傳播分類
支持向量機分類
模型評估與選擇
第五節 聚類
聚類的定義
K-均值算法
k-中心點算法
第六節 離群點檢測
離群點的概念
離群點檢測的方法
第七節 關聯規則(Association Rule)
關聯規則的定義
關聯規則挖掘步驟及相關概念
關聯規則挖掘方法分類
Apriori算法
第八節 FusionInsight Miner 和華為云機器學習服務MLS
FusionInsight Miner整體介紹
關系分析
標簽管理
華為云機器學習服務
第四章 大數據挖掘實戰
銀行定期存款業務預測
客戶分群
鮑魚生長年齡預測
認證考試
HCIE-Big Data 證書有效期與重認證方式
有效期:二年
重認證項目:在認證過期之前,通過目前提供的任意一門HCIE 筆試或實驗或面試。華為重認證項目詳情請參考手冊中對“華為重認證策略”的說明