《深度学习与图像处理》 | |
预 备 知 识 |
Python数据分析 解释器Python3.7与IDE:Anaconda/Pycharm 列表/元组/字典/类/文件 numpy/scipy/matplotlib/pandas的介绍和典型使用 scikit-learn的介绍和典型使用 TensorFlow典型应用 典型图像处理 多种数学曲线 多项式拟合 快速傅里叶变换FFT 奇异值分解SVD Soble/Prewitt/Laplacian算子与卷积网络 代码和案例实践: 卷积与(指数)移动平均线 股票数据分析 缺失数据的处理 环境数据异常检测和分析 |
第 一 节 |
卷积神经网络: 神经网络结构,滤波器,卷积 池化,激活函数,反向传播 目标分类与识别、目标检测与追踪 AlexNet、VGGNet、GoogleLeNet Inception-V3/V4 ResNet、DenseNet 代码和案例实践: 数字图片分类 卷积核与特征提取 以图搜图 人证合一 卷积神经网络调参经验分享 |
第 二 节 |
卷积神经网络高级应用、迁移学习: 使用迁移学习实现蒙古文识别 Keras的使用 获取中间隐层的特征及可视化 隐层特征的意义和使用 迁移学习的trick 学习率、衰减、冻结等问题 代码和案例实践: 猫狗大战详解 海量蒙古文识别 隐特征可视化及其应用 |
第 三 节 |
OpenCV图像处理 Skimage/OpenCV来源、简介与安装 将视频转换为图像序列 图像可视化与几何作图 HSV、RGB与图像颜色空间的转换 图像增强与(局部)直方图均衡化 给予边缘和区域的图像分割 gamma矫正和对数矫正 亮度区域检测与前景提取 图像边缘检测/特征提取与图像算子 Gabor/Laplace/Prewitt/Roberts Scharr/Sobel/Niblack/Wiener 图像形态学:开/闭/凸包/膨胀/腐蚀 双边滤波器/小波降噪/wiener滤波 角点检:Harris,Shi-Tomasi SIFT、SURF算法 视频分析:Meanshift 和 Camshift 算法 代码和案例实践: 不同算子下的图像卷积 图像边缘检测与提取 前景分割与图像融合 regional maxima检测与应用 HAAR/HOG/LBP等特征应用 视频前景背景分析与异物检测 图像形态学与海报生成的应用 光流跟踪与车辆跟踪 |
第 四 节 |
图像分割与定位 视频关键帧处理 卷积的位置不变形与图像定位的关系 物体检测与定位 RCNN,Fast-RCNN,Faster-RCNN,MaskRCNN YOLOv4、SSD UNet及其与残差网络的结合 FaceNet与特征 EfficientNet、EfficientDet 代码和案例实践: 人脸检测 OCR字体定位和识别 睿客识云 气象识别 |
第 五 节 |
生成对抗网络GAN 生成与判别 生成模型:贝叶斯、HMM到深度生成模型 GAN对抗生成神经网络 DCGAN Conditional GAN InfoGan Wasserstein GAN 代码和案例实践: 图片生成 看图说话 对抗生成神经网络调参经验分享 |
第 六 节 |
视频分类模型实例 视频帧的目标定位 YOLOv4、SSD 时空卷积网络 SlowFast 代码和案例实践: 视频分类的trick 政务大厅视频监控的真实系统 |
第 七 节 |
RNN循环神经网络 RNN基本原理 LSTM、GRU Attention CNN+LSTM模型 Bi-LSTM双向循环神经网络结构 编码器与解码器结构 特征提取:word2vec Seq2seq模型 代码和案例实践: 看图说话 藏头诗生成 问答对话系统 OCR 循环神经网络调参经验分享 |