企業管理培訓分類導航
企業管理培訓公開課計劃
企業培訓公開課日歷
2024年
職業技能培訓公開課
職業技能培訓內訓課程
熱門企業管理培訓關鍵字
Spark大數據挖掘工具Mllib實戰(機器學習)
【課程編號】:MKT028424
Spark大數據挖掘工具Mllib實戰(機器學習)
【課件下載】:點擊下載課程綱要Word版
【所屬類別】:職業技能培訓
【時間安排】:2025年02月18日 到 2025年02月19日5500元/人
2024年03月05日 到 2024年03月06日5500元/人
2023年03月21日 到 2023年03月22日5500元/人
【授課城市】:北京
【課程說明】:如有需求,我們可以提供Spark大數據挖掘工具Mllib實戰(機器學習)相關內訓
【課程關鍵字】:北京大數據挖掘培訓
我要報名
咨詢電話: | |
手 機: | 郵箱: |
課程介紹
隨著互聯網、移動互聯網和物聯網的發展,我們已經切實地迎來了一個大數據的時代。大數據是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合,對大數據的實時分析已經成為一個非常重要且緊迫的需求。目前對大數據的實時分析工具,業界公認最佳為Spark。Spark是一個開源集群運算框架,最初是由加州大學柏克利分校AMPLab所開發,Spark使用了內存內運算技術,在內存上的運算速度比Hadoop MapReduce的運算速度快上100倍,即便是在磁盤上運行也能快10倍。
為解決廣大系統設計人員深入研究與開發大數據挖掘和實時分析的需要,培訓中心特舉辦“Spark大數據挖掘工具MLlib實戰”培訓班,本課程主要講解Spark MLlib,Spark MLlib是一種高效、快速、可擴展的分布式計算框架,實現了常用的機器學習,如:聚類、分類、回歸等算法。講解各個算法的理論、詳細展示Spark源碼實現,最后均會通過實例進行解析實戰,幫助大家真正從理論到實踐全面掌握Spark MLlib分布式機器學習和大數據挖掘方法
培訓對象
1,系統架構師、系統分析師、高級程序員、資深開發人員。
2,牽涉到大數據實時處理的數據中心運行、規劃、設計負責人。
3,政府機關,金融保險、移動和互聯網等大數據來源單位的負責人。
4,高校、科研院所牽涉到大數據與分布式數據處理的項目負責人。
課程目標
1, 全面了解大數據實時處理技術的相關知識。
2,學習Spark的核心技術方法以及應用特征。
3,深入使用MLLib在大數據挖掘和實時分析中的使用。
4,掌握MLlib相關機器學習和數據挖掘工具的使用。
課程大綱
第一講 Spark大數據實時處理技術
1)大數據處理技術
2)Spark實時處理技術
3)Spark生態系統BDAS
4)Spark架構分析
第二講 Spark安裝配置及監控
1)Ubuntu環境的準備
2)Hadoop2.X和Scala
3)搭建Spark開發環境
4)Idea編譯和運行
5)Spark監控管理
第3講 Scala編程語言和分布式計算模型
1) Scala編程語言
2) 操作基本數據類型
3)Spark計算模型和RDD
4)Transformation及Actions算子
5)Spark MLlib矩陣向量
第四講 Spark MLlib線性回歸和邏輯回歸算法
1)線性回歸算法
2)線性回歸代碼實例
3)邏輯回歸算法
4)邏輯回歸回歸代碼實例
5)線性回歸和邏輯回歸代碼實操
第五講 Spark MLlib貝葉斯分類算法
1) 貝葉斯分類算法原理
2) Spark貝葉斯分類源碼
3) Spark貝葉斯分類代碼示例
4) 貝葉斯分類代碼實操
第六講 Spark MLlib決策樹算法
1) 決策樹算法原理
2) Spark決策樹算法源碼
3) Spark決策樹算法代碼示例
4) 決策樹代碼實操
第七講 Spark MLlib聚類算法
1) K-Means聚類算法原理
2) Spark K-Means聚類算法源碼
3) SparkK-Means聚類代碼示例
4) 聚類算法代碼實操
第八講 Spark MLlib關聯規則算法
1) FPGrowth關聯規則算法原理
2) FPGrowth關聯規則算法源碼
3) FPGrowth關聯規則代碼示例
4) 關聯規則代碼實操
第九講 Spark MLlib個性化推薦算法
1) 協同過濾推薦算法原理
2) Spark協同過濾推薦源碼
3) Spark協同過濾推薦代碼示例
4) 推薦代碼實操
第十講 Spark MLlib神經網絡算法
1) 神經網絡算法原理
2) Spark神經網絡算法源碼
3) Spark神經網絡代碼示例
4) 神經網絡代碼實操
楊老師
由業界知名大數據專家親自授課:
楊老師 主要研究網絡信息分析以及云計算相關技術,長期從事通信網管系統、網絡信息處理、商務智能(BI)以及電信決策支持系統的研究開發工作,主持和參與了多個國家和省部級基金項目,具有豐富的工程實踐及軟件研發經驗。