《深度學習與圖像處理》 | |
預 備 知 識 |
Python數據分析 解釋器Python3.7與IDE:Anaconda/Pycharm 列表/元組/字典/類/文件 numpy/scipy/matplotlib/pandas的介紹和典型使用 scikit-learn的介紹和典型使用 TensorFlow典型應用 典型圖像處理 多種數學曲線 多項式擬合 快速傅里葉變換FFT 奇異值分解SVD Soble/Prewitt/Laplacian算子與卷積網絡 代碼和案例實踐: 卷積與(指數)移動平均線 股票數據分析 缺失數據的處理 環境數據異常檢測和分析 |
第 一 節 |
卷積神經網絡: 神經網絡結構,濾波器,卷積 池化,激活函數,反向傳播 目標分類與識別、目標檢測與追蹤 AlexNet、VGGNet、GoogleLeNet Inception-V3/V4 ResNet、DenseNet 代碼和案例實踐: 數字圖片分類 卷積核與特征提取 以圖搜圖 人證合一 卷積神經網絡調參經驗分享 |
第 二 節 |
卷積神經網絡高級應用、遷移學習: 使用遷移學習實現蒙古文識別 Keras的使用 獲取中間隱層的特征及可視化 隱層特征的意義和使用 遷移學習的trick 學習率、衰減、凍結等問題 代碼和案例實踐: 貓狗大戰詳解 海量蒙古文識別 隱特征可視化及其應用 |
第 三 節 |
OpenCV圖像處理 Skimage/OpenCV來源、簡介與安裝 將視頻轉換為圖像序列 圖像可視化與幾何作圖 HSV、RGB與圖像顏色空間的轉換 圖像增強與(局部)直方圖均衡化 給予邊緣和區域的圖像分割 gamma矯正和對數矯正 亮度區域檢測與前景提取 圖像邊緣檢測/特征提取與圖像算子 Gabor/Laplace/Prewitt/Roberts Scharr/Sobel/Niblack/Wiener 圖像形態學:開/閉/凸包/膨脹/腐蝕 雙邊濾波器/小波降噪/wiener濾波 角點檢:Harris,Shi-Tomasi SIFT、SURF算法 視頻分析:Meanshift 和 Camshift 算法 代碼和案例實踐: 不同算子下的圖像卷積 圖像邊緣檢測與提取 前景分割與圖像融合 regional maxima檢測與應用 HAAR/HOG/LBP等特征應用 視頻前景背景分析與異物檢測 圖像形態學與海報生成的應用 光流跟蹤與車輛跟蹤 |
第 四 節 |
圖像分割與定位 視頻關鍵幀處理 卷積的位置不變形與圖像定位的關系 物體檢測與定位 RCNN,Fast-RCNN,Faster-RCNN,MaskRCNN YOLOv4、SSD UNet及其與殘差網絡的結合 FaceNet與特征 EfficientNet、EfficientDet 代碼和案例實踐: 人臉檢測 OCR字體定位和識別 睿客識云 氣象識別 |
第 五 節 |
生成對抗網絡GAN 生成與判別 生成模型:貝葉斯、HMM到深度生成模型 GAN對抗生成神經網絡 DCGAN Conditional GAN InfoGan Wasserstein GAN 代碼和案例實踐: 圖片生成 看圖說話 對抗生成神經網絡調參經驗分享 |
第 六 節 |
視頻分類模型實例 視頻幀的目標定位 YOLOv4、SSD 時空卷積網絡 SlowFast 代碼和案例實踐: 視頻分類的trick 政務大廳視頻監控的真實系統 |
第 七 節 |
RNN循環神經網絡 RNN基本原理 LSTM、GRU Attention CNN+LSTM模型 Bi-LSTM雙向循環神經網絡結構 編碼器與解碼器結構 特征提取:word2vec Seq2seq模型 代碼和案例實踐: 看圖說話 藏頭詩生成 問答對話系統 OCR 循環神經網絡調參經驗分享 |