大數據前沿技術分析與應用培訓(北京,5月24-26日)
【舉辦單位】北京曼頓培訓網
【培訓日期】上海,2017年4月17-19日;北京,2017年5月24-26日
【培訓地點】上海、北京
【培訓對象】
1,系統架構師、系統分析師、高級程序員、資深開發人員。
2,牽涉到數據挖掘和統計分析的數據中心運行、規劃、設計負責人。
3,政府機關,金融保險、移動和互聯網等大數據來源單位的負責人。
4,高校、科研院所牽涉到數據挖掘與統計分析處理的項目負責人。
【課程背景】
隨著互聯網、移動互聯網和物聯網的發展,我們已經切實地迎來了一個大數據的時代。如何對海量數據進行挖掘和分析,已經成為一個非常重要且緊迫的需求。
從2008年Natural正式定義"大數據"開始,以Hadoop為代表的大數據處理和分析工具,以其可伸縮性、健壯性、計算性能和成本上具有無可替代的優勢,事實上已成為當前互聯網企業主流數據分析平臺。大數據相關技術最近幾年出現了井噴的趨勢,眾多技術紛紛出現,典型的系統包括Hadoop、Spark、Flume、Scribe、Kafka、Storm、Mahout、MLlib、Docker等,涵蓋網絡數據爬取、日志采集、分布式消息訂閱、大數據分析挖掘等方面,涉及離線批處理、實時處理、流式處理等多種處理方式。這些技術來源于國外不同的著名大公司和科研院校(例如Storm源自Twitter,Spark源自UC Berkley),且大都以開源方式公開,用于解決不同的應用需求,涉及面廣,技術要求高,交叉知識范圍廣,知識內容更新頻繁,要理清其中的關系,從中發現最適合本機構的技術,成為了目前各機構技術專家的一個難點。
【培訓目標】
1、全面了解大數據前沿技術的相關知識。
2、學習大數據前沿技術平臺、方法以及應用特征。
3、學習使用大數據挖掘和分析中的使用。
4、了解Hadoop、Spark等技術的融合使用。
【課程大綱】
第一講 大數據技術基礎
1)大數據應用需求及潛在價值分析
2)大數據與數據庫解決方案的對比
3)國內外主流的大數據解決方案
4)開源的大數據生態系統平臺剖析
5)大數據下的技術選型與架構設計
第二講 批處理大數據平臺Hadoop
1)Hadoop及其運行架構
2)HDFS分布式文件系統
3)MapReduce計算模型
4)HBase大表管理技術
5)Hadoop平臺使用和實操
第三講 實時大數據平臺Spark
1)Spark實時處理技術
2)彈性分布式數據集RDD
3)Spark分布式計算框架
4)Spark的BDAS生態系統
5)Spark平臺使用和實操
第四講 流式大數據平臺Storm
1)流式大數據處理架構
2)Storm在企業應用介紹
3)Storm拓撲及流分組
4)Spout和Bolt詳解
5)分布式DPRC和Trident
6)Storm平臺使用和實操
第五講 Python網絡爬蟲
1)網絡爬蟲基礎
2)urllib和urllib2庫的用法
3)Python 正則表達式
4)Beautiful Soup使用
5)用Scrapy采集示例實操
第六講 大數據日志采集工具Flume
1)日志采集及Scribe介紹
2)Flume-NG數據流模型
3)Flume平臺架構
4)Flume集群部署配置
5)Flume應用案例實操
第七講 分布式消息訂閱工具Kafka
1)Kafka應用介紹
2)Kafka平臺架構
3)Kafka集群部署與配置
4)Kafka應用案例實操
第八講 NoSQL云數據處理工具
1)NoSQL技術及云數據庫介紹
2)HBase列數據存儲及處理機制
3)HBase高并發讀/寫實現及案例
4)MongoDB文檔數據存儲及處理
5)MongoDB操作實現及案例
第九講 大數據中的SQL工具
1)大數據中的類SQL工具
2) Hive設計目標和數據模型
3) Hive關鍵性技術和案例
4) SparkSQL設計目標和數據模型
5) SparkSQL關鍵性技術和案例
第十講 大數據分析挖掘工具
1)大數據挖掘及知識模型的發現
2)大數據挖掘工具Mahout和MLlib
3)推薦方法及MLlib電影推薦案例
4)分類方法及Mahout新聞分類案例
5)聚類方法及K-Means聚類案例
第十一講 資源虛擬化工具Docker
1)虛擬化和容器技術
2)LXC和Docker的發展
3)Docker架構及特性
4)鏡像、容器和倉庫
5)Docker的執行及其案例實操
第十二講 大數據技術展望
1)大數據分析技術展望
2)大數據平臺的發展展望
3)大數據挖掘的應用展望
【講師介紹】
楊老師,曼頓培訓網()資深講師。主要研究網絡信息分析以及云計算相關技術,長期從事通信網管系統、網絡信息處理、商務智能(BI)以及電信決策支持系統的研究開發工作,主持和參與了多個國家和省部級基金項目,具有豐富的工程實踐及軟件研發經驗。
【費用及報名】
1、費用:培訓費5800元(含培訓費、講義費);如需食宿,會務組可統一安排,費用自理。
2、報名咨詢:鮑老師
3、報名流程:電話登記-->填寫報名表-->發出培訓確認函
4、備注:如課程已過期,請訪問我們的網站,查詢最新課程
5、詳細資料請訪問北京曼頓培訓網:(每月在全國開設四百多門公開課,歡迎報名學習)
楊老師,曼頓培訓網()資深講師。主要研究網絡信息分析以及云計算相關技術,長期從事通信網管系統、網絡信息處理、商務智能(BI)以及電信決策支持系統的研究開發工作,主持和參與了多個國家和省部級基金項目,具有豐富的工程實踐及軟件研發經驗。
,系統架構師、系統分析師、高級程序員、資深開發人員。
2,牽涉到數據挖掘和統計分析的數據中心運行、規劃、設計負責人。
3,政府機關,金融保險、移動和互聯網等大數據來源單位的負責人。
4,高校、科研院所牽涉到數據挖掘與統計分析處理的項目負責人。
更新時間:2017/4/12 14:13:13