一、培训简述
课程中通过细致讲解,使学员掌握该技术的本质。具体收益包括:
1.掌握NLP基础
2.关键词提取与文本分类方法
3.文本向量化与句法分析方法
4.NLP与深度学习技术的相应算法
5.掌握图像识别技术
二、培训特色
本次培训从实战的角度对自然语言处理(NLP)进行了全面的剖析,并结合实际案例分析和探讨NLP的应用场景,给NLP相关从业人员以指导和启迪。
三、培训时长
共计3天,每天6课时
四、培训大纲
单元 |
培训模块 |
培训内容 |
第一单元 |
NLP入门与基础介绍(一) |
- NLP的基本概念
- NLP的发展历程
- NLP主要研究方向
- 句法语义分析
- 信息抽取
- 文本挖掘
- 机器翻译
- 信息检索
- 问答系统
- 对话系统
|
第二单元 |
NLP入门与基础介绍(二) |
- NLP的基础
- 分词
- 正向最大匹配算法
- 逆向最大匹配算法
- 双向最大匹配算法
- 基于N-gram语言模型的分词
- 基于HMM的分词方法
- 基于CRF的分词法法
- 文本基本处理
- 词性标注
- 基于最大熵的词性标注
- 基于统计最大概率输出词性
- 基于HMM词性标注
- 基于CRF的词性标注
- 命名实体识别
- 案例
- 在线中文分词系统实战
- 命名实体识别接口开发
- 基于词性标注的关键词提取
|
第三单元 |
关键词提取与文本分类(一) |
- 关键词提取概述
- 关键词提取算法
- TF-IDF
- LSA/LSI算法
- PLSA算法
- LDA算法
|
第四单元 |
关键词提取与文本分类(二) |
- 文本分类算法
- 朴素贝叶斯
- 线性分类器
- 支持向量机
- Bagging模型
- Boosting模型
- 浅层神经网络
- 案例
- 新闻主题提取
- 新闻分类实战
|
第五单元 |
文本向量化与句法分析(一) |
- 文本向量化概述
- 文本向量化常用算法
- 词袋算法
- HashTF算法
- Word2Vec算法
- Glove算法
|
第六单元 |
文本向量化与句法分析(二) |
- 句法分析概述
- 句法分析常用算法
- PCFG算法
- 条件随机场算法
- 案例
- 文本情感分析的开发示例
- 基于依存句法分词的问句相似度计算
|
第七单元 |
图像识别项目 |
- 介绍Google图像识别模型Inception-v3
- 使用Inception-v3做图像识别
|
第八单元 |
猫狗分类项目 |
1.图像数据预处理
2.猫狗分类-简单CNN
3.猫狗分类-VGG16-bottleneck
4.猫狗分类-VGG16-Finetune |
第九单元 |
验证码识别项目 |
1.多任务学习介绍
2.验证码识别项目 |
第十单元 |
目标检测项目 |
1.目标检测任务介绍
2.RCNN/Fast-RCNN/Faster-RCNN算法介绍
3.YOLO算法介绍
4.SSD算法介绍
5.目标检测项目实战 |
第十一单元 |
目标分割项目 |
1.目标分割任务介绍
2.全卷积网络
3.双线性上采样
4.特征金字塔
5.Mask RCNN算法介绍
6.目标分割项目实战 |
第十二单元 |
图像风格迁移项目 |
1.图像风格迁移介绍
2.图像风格迁移项目实战 |
第十三单元 |
GAN项目 |
1.生成式对抗网络GAN介绍
2.生成式对抗网络GAN项目实战 |
总结与考核 |
(注:大纲还可根据需求进行调整)
第二部分 师资简介
覃棅丰
创业公司技术负责人。机器学习,深度学习领域多年一线开发研究经验,精通算法原理与编程实践。曾使用Tensorflow,Caffe,Keras等深度学习框架完成过多项图像,语音,nlp,搜索相关的人工智能实际项目,研发经验丰富。拥有两项国家专利,同时具有多年授课培训经验,讲课通熟易懂,代码风格简洁清晰。
人工智能相关工作经历:
上海希格斯网络科技有限公司 数据挖掘工程师
1.负责深度学习NLP算法的研究和实现。
2.负责搜索引擎的实现和优化。
上海索洛信息技术有限公司 高级算法工程师
1.负责深度学习图像算法的研究和实现。
2.负责深度学习语音算法的研究和实现。
人工智能相关项目经验:
人岗匹配项目 负责算法实现
● 收集了10万份JD。
● 基于Tensorflow平台使用LSTM+Attention算法。
● 使用JD训练职位推荐模型。训练好的模型可用于分析简历描述,并根据简历描述推荐一个或多个适合的职位。
项目关键词提取项目 负责算法实现
● 收集了10万份项目描述,并标记好项目中的关键词。
● 基于Tensorflow平台使用seq2seq模型。
● 从简历的项目描述中提取出该项目中的重点词汇。可用于优化简历项目搜索结果。
人才搜索引擎项目 负责搜索引擎的实现和优化
● 搭建简历搜索引擎服务。
● 完成学校名,专业,公司,行业等模块的搜索策略
● 完成搜索结果高亮服务。
● 修改搜索bug优化搜索算法。
宠物脸识别项目 负责数据处理,算法实现
● 收集了5万张狗/猫的照片,并标记好它们脸部的区域。
● 在Linux下基于Caffe平台使用Faster-rcnn实现狗/猫脸检测算法。
● 推出了一款在线小游戏,用户上传自己家狗/猫的照片,服务器接收到照片之后用训练好的模型检测照片中狗/猫的脸,并把狗/猫的脸框出来,给它们的长相打一上个分数,再把处理后的照片反馈给用户。
宠物品种识别项目 负责数据处理,算法实现
● 收集了19种猫和27种狗的照片,共3万多张,并做好分类标签。
● 基于Caffe平台使用AlexNet,GoogleNet以及自己设计的网络实现宠物品种分类算法。
● 推出了一款在线小游戏,用户上传自己家狗/猫的照片,服务器接收到照片之后用训练好的模型检测照片中狗/猫的品种,不同宠物的品种会对应不同明星的脸,再把与宠物品种相似的明星脸反馈给用户。
宠物叫声情感分类项目 负责数据处理,算法实现
● 收集了1万6千条狗叫声,分成8个类别。
● 基于Tensorflow平台使用CNN,LSTM实现狗叫声情感分类算法。
● 将训练好的模型放到嵌入式设备中,实时判断当前场景是否有狗叫声,有狗叫声的话是属于什么分类。