一、課程簡介
在當今這個數據驅動的時代,大數據已成為企業決策、產品創新及市場洞察的核心驅動力。同時,隨著人工智能技術的飛速發展,以DeepSeek為代表的先進語言模型正深刻改變著我們的工作方式與交流模式。本課程旨在融合大數據挖掘的深度、數據可視化的直觀性以及DeepSeek等AI工具的前沿性,為職場人士打造一套全面的技能提升方案,助力其在數字化轉型的浪潮中脫穎而出。
參加培訓并通過考試學員,將獲得由工業和信息化部教育與考試中心統一頒發《大數據挖掘技術(高級)》工業和信息化職業能力證書。證書可作為專業技術人員職業能力考核的證明,以及專業技術人員崗位聘用、任職、定級和晉升職務的重要依據。
二、適合對象
大數據系統研發工程師
大數據分析師
數據安全研發人員
大數據應用開發工程師
數據可視化工程師
數據科學研究人員等
三、認證收益
深度講解Python的高級用法;
掌握數據挖掘核心技術;
通過Python構造數據挖掘算法;
Python數據挖掘實戰案例;
Seaborn可視化開發;
通過DeepSeek提升辦公效率。
四、培訓信息
1)培訓方式
培訓采用線下專家面授+同步直播的形式。所有課程均贈送學習教材、視頻回放、題庫模考、答疑交流群、促學服務等。并對考生提供專人約考、考試指導、證書郵寄等。多維度教學,一站式服務,滿足不同企業及學員的學習需求。
2)培訓班次
2025年06月26-28日 北京
2025年09月24-26日 廣州
2025年12月27-29日 長沙
五、培訓內容
培訓共計3天,每天6小時,具體日程安排如下:
日程 | 主題 | 內容 |
第一天 上午 |
數據分析實戰 | 第一講 零基礎學Python 講解Python背景、國內發展狀況、基礎語法、數據結構及繪圖操作等內容。特別針對向量計算模塊,著重介紹Python在這方面的優勢及用法。 |
第二講 數據分析方法論 講解統計分析基礎,包括統計學基本概念,假設檢驗,置信區間等基礎,并結合數據案例說明其使用場景和運用方法。介紹數據分析流程和常見分析思路,同時結合案例進行講解。 |
||
第三講 數據處理技法 從數據接入、數據統計、數據轉換等幾個方面進行講解。數據接入包含接入MySQL、Oracle、Hadoop等常見數據庫操作;數據統計包含Pandas包的具體用法和講解;數據轉換包含對數據集的關聯、合并、重塑等操作。此外,針對海量數據的情況下,介紹在Spark平臺上的數據處理技術,并結合真實環境進行操作講解。 |
||
第一天 下午 |
數據挖掘理論及核心技術 | 第四講 認識數據挖掘 講解數據挖掘基本概念,細致講解業務理解、數據理解、數據準備、建立模型、模型評估、模型部署各環節的工作內容及相關技術;結合業界經典場景,講解數據挖掘的實施流程和方法體系。 |
第五講 數據挖掘核心技術 細致講解抽樣、分區、樣本平衡、特征選擇、訓練模型、評估模型等數據挖掘核心技術原理,并結合案例講解其具體實現和用法。尤其針對樣本平衡,重點講解人工合成、代價敏感等算法;針對特征選擇,重點講解特征選擇的核心思路,并結合Python進行案例演示。 |
||
第二天 上午 |
大數據算法原理及案例實現(1) | 第六講 特征降維算法及Python實現 降維是大數據分析非常重要的算法,它可以在降低極少信息量的情況下,極大地縮小數據規模。主要講解主成分、LDA以及t-SNE原理,并結合案例進行Python實現。特別地,針對海量數據情況下的應用場景,講解實現思路和Python案例。 |
第七講 決策樹算法及Python實現 決策樹是非常經典的算法,一般常見于小數據的挖掘。由于決策樹具有極強的可解釋性,針對海量數據仍然是非常重要的實用價值。主要講解ID3、C4.5、C5.0以及CART決策樹算法的實現原理,并結合案例進行Python實現。 |
||
第八講 好萊塢百萬級影評數據分析與電影推薦實現 實戰部分:基于好萊塢百萬級的影評數據,對數據進行建模、清洗、透視表操作。然后根據用戶畫像分析不同的用戶喜好通過機器學習算法對不同性別、年齡階段的用戶進行定制化的電影推薦,最后把推薦的電影進行可視化的展示操作。 |
||
第二天 下午 |
大數據算法原理及案例實現(2) | 第九講 因果推理算法及Python實現 大數據分析技術可以幫助我們去發現、解決一些業務問題,然而如何去判斷我們的改進是否生效,是否在業務指標上呈現過一定的因果邏輯,則是一個重要問題和分析方向。本節主要介紹因果推理算法,包括貝葉斯推理、狀態空間模型以及CausalImpact工具等內容,并結合案例進行Python實現。 |
第十講 深度學習算法及Python實現 對于大數據的建模任務,我們可以基于深度學習來實現,不僅能夠針對海量數據進行建模,其效果也非常不錯。本節主要講解深度學習的發展歷程,DBN、DNN等經典深度學習算法,深度學習優化算法以及一些技巧。同時,介紹Keras、OpenCV庫的使用方法,并結合案例進行Python實現。 |
||
第十一講 采用YOLO實現計算機視覺技術 實戰部分:基于YOLO面部模型,完成對圖片和視頻的人臉識別,實戰中會講解YOLO的重要類和函數。主要內容包括YOLO庫的安裝和部署、圖像增強、像素操作、圖形分析等各種技術,并且詳細介紹了如何處理來自文件或攝像機的視頻,以及如何檢測和跟蹤移動對象。 |
||
第三天 上午 |
Python可視化應用實戰 | 第十二講 數據分析圖表及Python案例 數據可視化是大數據分析的重要手段,通過合理地使用圖表,不僅可以簡潔地表達數據的含義,高效地發現問題,還可以為報告的編寫以及數據分析web應用增色不少。本節主要講解常用的數據分析圖表及其使用場景,介紹數據可視化的方法論,避免生搬硬套的使用圖表,針對不同的業務場景和需求,合理選擇可視化方法。介紹的工具不限于matplotlib、pycha、pyecharts、ggplot、Bokeh、HoloViews、mpld3、plotly、pygal等常用可視化庫。 |
第十四講 使用Notebook編寫數據分析報告 數據分析報告在大數據分析過程中具有重要價值,它體現了大數據分析的目的、過程和結果,以及對發現問題的解讀、改進方案等。本節主要講解使用Notebook編寫數據分析報告的具體方法,以及編寫數據分析報告的方法論,并結合案例講解其用法。 |
||
第三天 下午 |
DeepSeek AI職場賦能 | 第十五講 DeepSeek AI辦公賦能 DeepSeek作為一款全能型AI助手,致力于提升職場工作效率。通過其核心功能,DeepSeek能幫助職場人士自動化處理會議紀要、合同提取、PPT制作等日常任務,從而節省時間并提高工作效率。它還能夠通過精準的數據分析為決策提供洞察,并激發創意生成內容,如短視頻腳本和文案,徹底打破傳統內容生成的思維模式。 |
第十六講Dify與DeepSeek R1的整合應用 Dify是一款低代碼應用開發平臺,通過與DeepSeek R1的無縫集成,能夠快速構建定制化的智能應用。利用Dify,用戶可以輕松實現工作流自動化和智能增強,進一步提升業務效率。DeepSeek R1在客服自動應答、智能文檔處理、數據分析等多個場景中得到廣泛應用,通過優化工作流,簡化多步驟任務,提高整體業務流程的自動化水平,從而實現職場賦能和創新驅動。 |
六、講師團隊
劉老師 | 中培特聘大數據專家
擁有十幾年軟件研發經驗,十年企業培訓經驗,對Java、Python、區塊鏈等技術領域有獨特的研究,精通J2EE企業級開發技術。
Java方向:設計模式、Spring MVC、MyBatis、Spring、StringBoot、WebService、CXF并且對Java源碼有深入研究。
Python方向:Python OOP、Mongodb、Django、Scrapy爬蟲、基于Surprise庫數據推薦,Tensorflow人工智能框架、人臉識別技術。
區塊鏈方向:BitCoin、Solidity、Truffle、Web3、IPFS、Hyperledger Fabirc、Go、EOS。
郭老師 | 上海軟件協會考評員
國內數據治理專家、高級產品經理、優秀項目管理培訓師,計算機專業碩士,曾任中國電信高級工程師,現任某信息技術公司產品及技術總監。上海軟件協會高級講師、上海軟件協會考評員、共青團上海市委員會青年(大學生)職業訓練營上海市政府指定講師、浦東軟件園高級講師。18年+開發、設計經驗,10年+數據治理培訓/咨詢經驗,給多家上市公司企業研發團隊做過培訓或咨詢業務,對企業數字化轉型、數據治理、產品管理有著敏銳、獨特的認知體系。