课程十六大阶段概述
阶段 | 阶段名称 | 实战项目 | 收益 |
---|---|---|---|
第一阶段 | python基础与科学计算模块 | √ 泰坦尼克号数据分析案例√ 可视化剖析逻辑回归损失函数案例 | 算法先行,技术随后。学习人工智能领域基础知识熟练掌握,打好坚实的内功基础。 |
第二阶段 | AI数学知识 | √ 梯度下降和牛顿法推导√ SVD奇异值分解应用 | |
第三阶段 | 线性回归算法 | √ 代码实现梯度下降求解多元线性回归√ 保险花销预测案例 | |
第四阶段 | 线性分类算法 | √ 分类鸢尾花数据集√ 音乐曲风分类√ SVM人脸识别案例√ SVM算法代码实现 | |
第五阶段 | 无监督学习算法 | √ 微博用户聚类分析√ PCA提取人脸图片特征脸√ 图片前景背景分离√ 根据声音判别性别√ 根据声音判别用户 | 悟其精髓,实践真理。大量机器学习实战,实践完成可胜任机器学习工程师岗位。 |
第六阶段 | 决策树系列算法 | √ 通过graphvis绘制决策树模型√ 用户画像集成学习方法案例√ Adaboost算法做人脸识别√ GBDT+LR架构实现 | |
第七阶段 | Kaggle实战 | √ CTR广告预估项目√ 网页分类案例√ 药店销量预测案例√ 活动推荐预测案例√ 银行贷款风控案例 | 悟其精髓,实践真理。大量机器学习实战,实践完成可胜任机器学习工程师岗位。 |
第八阶段 | 海量数据挖掘工具 | √ 代码实战WordCount计算和排序√ 代码实战蒙特卡洛计算圆周率Pi | |
第九阶段 | 概率图模型算法 | √ 代码实战垃圾邮件分类 | |
第十阶段 | 深度学习原理到进阶实战 | √ 水泥强度预测案例及绘制神经网络拓扑√ Python实现神经网络实战案例√ MNIST手写数字识别项目案例√ California房价预测案例 | 进军深度,提高内功。通过之前铺垫,进入深度学习,体悟深度黑盒子。 |
第十一阶段 | 图像识别原理到进阶实战 | √ Cifar10图像识别案例√ 皮肤癌医疗图像项目√ 图像风格迁移项目√ 车牌识别案例√ 通用物体检测项目 | 图像识别,妙趣横生。图像识别项目,让您体会智能的的人脑工作流程。助您登上图像算法工程师岗位。 |
第十三阶段 | 图像识别项目 | √ 电缆缺陷检测√ 电子元件缺陷检测√ 安全帽检测√ 人脸识别 | |
第十二阶段 | 自然语言处理原理到进阶实战 | √ TF代码实现Word2Vec算法项目√ 深度学习用户画像项目√ 电影评论情感分析案例√ 机器写唐诗案例√ 产生式自动聊天机器人√ POS词性标注案例√ NER命名实体识别案例√ 语义相似度分析案例√ Bert as service开源项目 | 奥秘语言,智能客服。自然语言处理,企业数据集核心痛点,实体识别、语言识别、相似度计算完成企业90%的文本需求。助力您荣登NLP工程师宝座。 |
第十四阶段 | 自然语言处理项目 | √ OCR识别√ 实体关系抽取√ 自动聊天机器人√ 知识图谱 | |
第十五阶段 | 数据挖掘项目 | √ 推荐系统√ 智能商业分析 | 出师在即,豪礼相送。双热门项目祝您开启精彩人生道路,制定适合你的职业道路。 |
第十六阶段 | 面试和成功求职的秘籍 |
预科阶段:快速实战入门
章节名称 | 主要学习方向 | ◆ 阶段概述:本阶段讲解,人工智能的应用,人工智能的工作流程、基本概念,人工智能的任务和本质,KNN最近邻算法。◆ 达成目标:通过本阶段学习,快速理解人工智能能做什么,要做什么,并掌握KNN算法以及算法的代码实现。 |
---|---|---|
人工智能概念与本质 | 1) 人工智能应用2) 人工智能流程与本质3) 人工智能流程对比人类思考过程4) 机器学习与深度学习本质区别5) 回归与分类任务本质6) 聚类与降维任务本质 | |
KNN算法 | 1) KNN原理2) Anaconda运行环境安装3) Pycharm开发环境配置安装4) KNN的python代码实现5) Scikit-learn模块讲解6) KNN的sklearn代码实战 |
第一阶段:python基础与科学计算模块
章节名称 | 主要学习方向 | ◆ 阶段概述:本阶段讲解,python基础语法,Numpy科学计算模块,Pandas数据分析模块,Matplotlib和Seaborn数据可视化模块。◆ 达成目标:通过本阶段学习,让学生快速掌握python语言的特性和语法,并着重对算法这块所涉及的Numpy科学计算模块和Pandas数据分析模块进行讲解。◆ 实战教学项目:√ 泰坦尼克号数据分析案例 √ 可视化剖析逻辑回归损失函数案例 |
---|---|---|
Python基础语法 | 1) 循环控制2) 切片操作3) 数据类型4) 集合操作5) 常用内建函数6) 函数式编程7) 类与对象8) 继承9) 装饰器10) 生成器 | |
科学计算模块Numpy | 1) Numpy ndarray对象2) Numpy 数据类型3) Numpy 数组属性4) Numpy 创建数组5) Numpy 切片和索引6) Numpy 高级索引7) Numpy 广播8) Numpy 数组操作9) Numpy 数学和统计函数10) Numpy 排序、条件过滤函数11) Numpy 线性代数 | |
数据处理分析模块Pandas | 1) Pandas IO文件操作2) Pandas 索引和数据选择器3) Pandas 合并、连接4) Pandas 缺失值数据处理5) Pandas 数据离散化6) Pandas 统计计算 | |
数据可视化模块 | 1) Matplotlib 散点图、线图、核密度图2) Matplotlib 饼图、直方图、盒图3) Matplotlib 等高线图4) Matplotlib 可视化剖析逻辑回归损失函数5) Seaborn 单变量、多变量的图形绘制6) Seaborn Style和Color7) Seaborn facetgrid |
第二阶段:AI数学知识
章节名称 | 主要学习方向 | ◆ 阶段概述:本阶段讲解,微积分基础,线性代数基础,多元函数微分学,线性代数高级,概率论,最优化。◆ 达成目标:通过本阶段学习,掌握后面机器学习算法、深度学习算法涉及的数学知识,使得后面在理解算法推导的过程中游刃有余。如果学员大学数学知识还未忘记或者研究生毕业,这一部分可以先跳过学习后面的知识。 |
---|---|---|
微积分基础 | 1) 导数的定义2) 左导数、右导数、可导函数3) 导数几何意义、物理意义4) 基本函数求导公式5) 四则运算法则6) 复合函数求导法则7) 神经网络激活函数的导函数求解8) 高阶导数9) 导数与函数单调性10) 极值定理11) 导数与函数凹凸性12) 一元函数泰勒展开 | |
线性代数基础 | 1) 向量与其运算2) 行向量和列向量3) 向量加减、数乘、内积、转置4) 向量范数5) 特殊向量6) 矩阵与其运算7) 方阵、对称阵、单位阵、对角阵8) 矩阵加减、数乘、矩阵乘法、转置9) 逆矩阵10) 行列式 | |
多元函数微分学 | 1) 偏导数2) 高阶偏导数3) 梯度4) 雅可比矩阵5) Hessian矩阵6) 极值判别法则 | |
线性代数高级 | 1) 二次型2) 特征值和特征向量3) 特征值分解4) 多元函数的泰勒展开5) 矩阵和向量的求导公式6) 奇异值分解7) 奇异值分解计算方式8) 奇异值分解性质9) SVD用于数据压缩10) SVD用于PCA降维11) SVD用于协同过滤12) SVD用于矩阵求逆 | |
概率论 | 1) 随机事件和随机事件概率2) 条件概率和贝叶斯公式3) 随机事件的独立性4) 随机变量5) 数学期望和方差6) 常用随机变量服从的分布7) 随机向量8) 随机变量独立性9) 协方差与协方差矩阵10) 随机向量的常见分布11) 最大似然估计 | |
最优化 | 1) 局部最小和全局最小2) 迭代法求解3) 梯度下降法推导4) 牛顿法推导5) 坐标下降法6) 数值优化算法的问题7) 凸集8) 凸函数9) 凸优化问题10) 拉格朗日乘数法11) 拉格朗日对偶12) KKT条件 |
第三阶段:线性回归算法
章节名称 | 主要学习方向 | ◆ 阶段概述:本阶段讲解,多元线性回归,梯度下降法,归一化,正则化,Lasso回归,Ridge回归,多项式回归。◆ 达成目标:通过本阶段学习,从推导出多元线性回归算法的损失函数,到实现开发和应用算法,再到对算法从数据预处理上,以及损失函数上的优化都将整体彻底掌握。对后面学习更多算法,甚至深度学习都将起到举一反三的效果。◆ 实战教学项目:√ 代码实现梯度下降求解多元线性回归 √ 保险花销预测案例 |
---|---|---|
多元线性回归 | 1) 简单线性回归2) 最优解与最小二乘法3) 多元线性回归判别式4) 多元线性回归的数学假设5) 利用MLE推导出目标函数6) 对数似然推导出MSE损失函数7) MSE求偏导得到参数解析解8) 多元线性回归的python代码实现9) 多元线性回归的sklearn代码实战 | |
梯度下降法 | 1) 梯度下降法原理与公式2) 学习率设置的学问3) GD应用于多元线性回归的流程4) 全量梯度下降的原理与代码实现5) 随机梯度下降的原理与代码实现6) Mini-Batch梯度下降的原理与代码实现7) 代码实现增加MBGD数据的随机性8) 代码实现动态调整学习率 | |
归一化 | 1) 归一化目的与量纲2) 归一化提高模型精度3) 最大值最小值归一化与缺点4) 方差归一化与好处5) 均值归一化与好处6) 标准归一化的代码实战与技巧 | |
正则化 | 1) 提高泛化能力与防止过拟合2) 正则化用于损失函数3) L1与L2正则项与范数的关系4) 结合GD讲解L1L2的几何意义5) 透过导函数讲解L1的稀疏性6) 透过导函数讲解L2的平滑性 | |
Lasso回归、Ridge回归、多项式回归 | 1) Lasso回归原理与代码实战2) Ridge回归原理与代码实战3) ElasticNet回归原理与代码实战4) 升维的意义5) 多项式回归进行升维原理6) 多项式升维代码实战 |
第四阶段:线性分类算法
章节名称 | 主要学习方向 | ◆ 阶段概述:本阶段讲解,逻辑回归算法,Softmax回归算法,SVM支持向量机算法,SMO优化算法。◆ 达成目标:通过本阶段学习,推导逻辑回归算法、SVM算法的判别式和损失函数,算法的优化、实现算法和应用开发实战。将会对分类算法有深入认知,对于理解后续神经网络算法和深度学习学习至关重要。◆ 实战教学项目:√ 分类鸢尾花数据集 √ 音乐曲风分类 √ SVM人脸识别案例 √ SVM算法代码实现 |
---|---|---|
逻辑回归 | 1) Sigmoid函数特点2) 广义线性回归与逻辑回归的数学假设3) 证明伯努利二项分布属于指数族分布4) 推导出逻辑回归判别式5) 推导出逻辑回归损失函数log loss6) 推导出损失函数导函数用于最优化7) 逻辑回归解决多分类问题OVR8) 逻辑回归代码实战–鸢尾花数据集分类 | |
Softmax回归 | 1) Softmax函数特点2) 广义线性回归与Softmax回归的数学假设3) 证明多项式分布属于指数族分布4) 推导出Softmax回归判别式5) 推导出Softmax回归损失函数cross-entropy6) 证明逻辑回归是Softmax的特例7) 剖析逻辑回归多分类和Softmax多分类的本质区别8) Softmax回归代码实战–音乐曲风分类 | |
SVM支持向量机 | 1) SVM与感知机关系2) 几何距离和函数距离3) SVM支持向量机算法原理4) SVM的损失函数5) 硬间隔SVM的优化步骤6) 软间隔SVM7) 非线性SVM与核函数8) SVM在sklearn模块中参数详解9) SVM人脸识别案例10) SVM的概率化输出11) SVM的OVO多分类12) SVM的hinge loss | |
SMO优化算法 | 1) SMO优化算法的子二次规划问题思路2) SMO把目标函数从二元函数变一元函数3) SMO推导出新的α和旧的α关系4) SMO对α进行剪裁5) SMO优化SVM算法代码实现 |
第五阶段:无监督学习算法
章节名称 | 主要学习方向 | ◆ 阶段概述:本阶段讲解,K-means聚类算法,K-means聚类算法的变形,密度聚类,层次聚类、谱聚类、PCA降维算法、EM期望最大化、GMM高斯混合模型。◆ 达成目标:通过本阶段学习,掌握无监督机器学习算法的作用和原理,透彻理解聚类和降维的本质区别,今后可以正确选择无监督学习算法,并实战开发。◆ 实战教学项目:√ 微博用户聚类分析 √ PCA提取人脸图片特征脸 √ 图片前景背景分离 √ 根据声音判别性别 √ 根据声音判别用户 |
---|---|---|
聚类系列算法 | 1) 相似度测量方法2) K-means算法原理3) K-means图像应用案例4) K-medoids算法5) K-means++算法6) Mini-batch K-means算法7) Canopy聚类算法8) Agnes层次聚类算法9) Diana层次聚类算法10) DBSCAN密度聚类算法11) Spectral谱聚类12) 微博用户聚类分析案例 | |
PCA降维算法 | 1) 特征选择与特征映射2) 最大投影方差原理与推导3) 最小投影距离原理与推导4) PCA过程的中心化5) Kernelized PCA6) SVD奇异值分解用于PCA | |
EM算法 | 1) Jensen不等式2) EM算法的E-step3) EM算法的M-step4) EM在GMM公式推导中应用 | |
GMM算法 | 1) 单一高斯分布的参数估计2) 混合高斯分布的似然函数3) GMM的计算流程4) GMM之图片前景背景分离代码实战5) GMM之根据声音判别性别代码实战6) GMM之根据声音判别用户代码实战 |
第六阶段:决策树系列算法
章节名称 | 主要学习方向 | ◆ 阶段概述:本阶段讲解,决策树算法、随机森林算法、Adaboost算法、GBDT算法、XGBoost算法。◆ 达成目标:通过本阶段学习,掌握非线性决策树系列算法,重点掌握Kaggle神奇XGBoost算法,理解GBDT和XGBoost涉及的公式推导,本阶段的掌握将大大提升学员数据挖掘的能力,对于后续理解Kaggle实战阶段内容会起到很大的帮助。◆ 实战教学项目:√ 通过graphvis绘制决策树模型 √ 用户画像集成学习方法案例 √ Adaboost算法做人脸识别 √ GBDT+LR架构代码实现 |
---|---|---|
决策树算法 | 1) 决策树的算法原理与数学表达2) 分裂指标Gini系数、信息增益、信息增益率3) 前剪枝与后剪枝4) 决策树ID3、C4.5和CART5) 决策树算法优略比较6) 决策树之鸢尾花数据集分类案例7) 通过graphvis绘制决策树模型 | |
随机森林算法 | 1) 集成学习算法思想Bagging、Boosting、Stacking2) 用户画像集成学习方法案例3) OOB数据集验证随机森林算法4) 随机森林副产品之特征选择 | |
Adaboost算法 | 1) Adaboost算法原理2) 数据的权重与权重错误率3) 权重错误率调整到0.5训练下一个弱分类器4) 计算每个样本的权重Un5) 应用Adaboost算法做人脸识别 | |
GBDT算法 | 1) 函数空间的梯度下降与负梯度2) 推导GBDT回归是拟合残差3) Shrinkage衰减系数的作用4) 推导GBDT分类亦是拟合残差5) GBDT二分类模型训练和使用6) GBDT多分类模型训练和使用7) GBDT副产品之特征组合用于降维8) 实现GBDT+LR架构代码实战 | |
XGBoost算法 | 1) XGBoost算法与决策树集成学习关系2) XGBoost目标函数与正则项3) XGBoost目标函数用二阶泰勒展开4) 推导简化XGBoost目标函数引入g h5) XGBoost目标函数加入树的复杂度6) 推导出XGBoost目标函数最终形式和叶子节点表达式7) 详解XGBoost算法参数与交叉验证8) XGBoost算法调用GPU显卡资源加速 |
第七阶段:Kaggle实战
项目名称 | 项目介绍 | ◆ 阶段概述:本阶段讲解,CTR广告预估项目、网页分类案例、药店销量预测案例、活动推荐预测案例、银行贷款风控案例。◆ 达成目标:通过本阶段学习,实战代码深刻理解前面学过的算法和工具,Kaggle竞赛数据集全部来自于公司,并且需求直接是企业里面的需求,并且此阶段讲解的代码均是大牛级开源的代码。要知道Kaggle上的大牛会一般企业的算法工程师水平高,所有同学学习Kaggle实战将会受益匪浅。◆ 实战教学项目:√ CTR广告预估项目 √ 网页分类案例 √ 药店销量预测案例 √ 活动推荐预测案例 √ 银行贷款风控案例 |
---|---|---|
CTR广告预估项目 | ||
网页分类案例 | ||
药店销量预测案例 | ||
活动推荐预测案例 | ||
银行贷款风控案例 |
第八阶段:海量数据挖掘工具
章节名称 | 主要学习方向 | ◆ 阶段概述:本阶段讲解,分布式概念,Spark分布式计算框架,SparkMLlib模块,SparkML模块。◆ 达成目标:通过本阶段学习,掌握一个海量数据挖掘工具Spark,这对于在企业中面对海量数据,进行机器学习数据挖掘时多个选择,并且在Kaggle实战和推荐系统项目中也会用到此阶段知识。 |
---|---|---|
Spark计算框架基础 | 1) 分布式存储和计算概念2) Spark计算框架特点3) 分布式计算Shuffle流程4) Spark RDD五大特性5) PySpark模块安装与配置6) 代码实战WordCount计算和排序7) 代码实战蒙特卡洛计算圆周率Pi | |
Spark计算框架深入 | 1) 算子操作Transformation和Action2) RDD持久化3) 宽窄依赖4) Spark DAG优化5) Spark架构运行剖析6) 读取分布式HDFS数据与并行度设置 | |
Spark机器学习MLlib和ML模块 | 1) MLlib的LocalVector之稠密向量和稀疏向量2) MLlib的有监督学习数据类型LabeledPoint3) ML中用到的DataFrame数据框操作4) ML中用到的UDF函数5) ML的pipeline流程思路 |
第九阶段:概率图模型算法
章节名称 | 主要学习方向 | ◆ 阶段概述:本阶段讲解,贝叶斯分类算法、隐含马尔可夫模型、最大熵模型、条件随机场。◆ 达成目标:通过本阶段学习,掌握NLP自然语言处理的一些基本算法,本阶段的理解对于后续完成NLP大项目很重要。◆ 实战教学项目:√ 代码实战垃圾邮件分类 |
---|---|---|
贝叶斯分类 | 1) 朴素贝叶斯分类器2) 拉普拉斯估计3) 代码实战垃圾邮件分类 | |
HMM算法 | 1) 马尔可夫过程2) 初始概率、转移概率、发射概率3) 隐含马尔可夫模型原理4) 维特比算法 | |
最大熵模型 | 1) 熵、条件熵、相对熵、互信息2) 最大熵模型算法原理3) 有约束条件的函数最优化问题4) 最大熵和最大似然估计关系5) IIS算法 | |
CRF算法 | 1) 条件随机场的性质2) 条件随机场的判别函数3) 条件随机场的学习4) 条件随机场的推断5) CRF与HMM关系 |
第十阶段:深度学习原理到进阶实战
章节名称 | 主要学习方向 | ◆ 阶段概述:本阶段讲解,神经网络算法、Back Propagation反向传播推导、TensorFlow框架、TensorBoard模块。◆ 达成目标:通过本阶段学习,开启深度学习之旅,深入理解神经网络算法及其优化算法,掌握TensorFlow开发流程,通过实现神经网络完成回归和分类任务。TensorFlow框架学好了,其它深度学习框架比如Keras、PyTorch掌握起来易如反掌。◆ 实战教学项目:√ 水泥强度预测案例及绘制神经网络拓扑 √ Python实现神经网络实战案例 √ MNIST手写数字识别项目案例 √ California房价预测案例 |
---|---|---|
神经网络 | 1) 从生物神经元到人工神经元2) 激活函数Relu、Tanh、Sigmoid3) 透过神经网络拓扑理解逻辑回归分类4) 透过神经网络拓扑理解Softmax回归分类5) 透过神经网络隐藏层理解升维降维6) 剖析隐藏层激活函数必须是非线性的原因7) 神经网络在sklearn模块中的使用8) 水泥强度预测案例及绘制神经网络拓扑 | |
BP反向传播算法 | 1) BP反向传播目的2) 链式求导法则3) BP反向传播推导4) 不同激活函数在反向传播应用5) 不同损失函数在反向传播应用6) Python实现神经网络实战案例 | |
TensorFlow深度学习工具 | 1) TF安装(包含CUDA和cudnn安装)2) TF实现多元线性回归之解析解求解3) TF实现多元线性回归之梯度下降求解4) TF预测california房价案例5) TF实现Softmax回归6) Softmax分类MNIST手写数字识别项目案例7) TF框架模型的保存和加载8) TF实现DNN多层神经网络9) DNN分类MNIST手写数字识别项目案例10) Tensorboard模块可视化 |
第十一阶段:图像识别原理到进阶实战
章节名称 | 主要学习方向 | ◆ 阶段概述:本阶段讲解,卷积神经网络、深度神经网络的问题和优化手段、经典卷积神经网络模型、OpenCV模块、目标检测算法原理与实战。◆ 达成目标:通过本阶段学习,深入透彻的掌握图像识别领域深度学习的原理和应用。通过知识点的讲解,辅助论文讲解和源码的剖析,让同学可以了解网络的底层架构原理和代码,可以说此阶段虽然内容多,但对面试图像识别领域岗位来说很重要,值得多花心思反复研究。◆ 实战教学项目:√ Cifar10图像识别案例 √ 皮肤癌医疗图像检测项目 √ 图像风格迁移项目 √ 车牌识别案例 √ 通用物体检测项目 |
---|---|---|
卷积神经网络原理 | 1) 感受野与卷积2) 卷积的计算3) 权值共享4) Stride步长5) Padding模式6) Pooling池化7) TF实现CNN卷积神经网络8) CNN分类MNIST手写数字识别项目案例 | |
卷积神经网络优化 | 1) 梯度消失与梯度爆炸2) Dropout防止过拟合3) Relu激活函数变形4) Xavier Glorot初始化5) Optimizer优化器6) Data Augmentation数据增强7) Batch Normalization归一化8) Cifar10图像识别案例 | |
经典卷积网络算法 | 1) LeNet2) AlexNet3) VGG164) InceptionV35) ResNet6) DenseNet7) MobileNet8) 皮肤癌医疗图像检测项目9) GAN生成对抗网络10) 图像风格迁移项目 | |
OpenCV模块 | 1) 读取IP摄像头2) RGB与HSV空间变换3) 直方图均值化4) 边缘检测5) 人脸检测6) 物体追踪7) 车道线检测8) 车牌识别案例 | |
古典目标检测算法 | 1) 图像金字塔2) 古典目标检测架构3) ROI、IOU、FPS、NMS、mAP4) IOU代码实现5) NMS代码实现6) 特征金字塔7) SPP net8) ROI池化 | |
现代目标检测算法 | 1) Fast R CNN2) Faster R CNN3) RPN网络、Anchor boxes4) Mask R CNN5) SSD6) Yolo V1 V2 V37) Cascade R CNN8) 模型压缩 |
第十二阶段:自然语言处理原理到进阶实战
章节名称 | 主要学习方向 | ◆ 阶段概述:本阶段讲解,词向量、词嵌入、RNN、LSTM、孪生网络、CNN在NLP中的应用、Attention注意力机制、Transformer、BERT。◆ 达成目标:通过本阶段学习,掌握NLP中词的各种向量表达,从古典的Word2Vec方式到现代的BERT方式,学好这些NLP提特征的主干网络,才能在NLP各项任务中产生好的效果。这阶段也将掌握大量NLP任务的实战开发。◆ 实战教学项目:√ TF代码实现Word2Vec算法项目 √ 深度学习用户画像项目 √ 电影评论情感分析案例 √ 机器写唐诗案例 √ 产生式自动聊天机器人 √ POS词性标注案例 √ NER命名实体识别案例 √ 语义相似度分析案例 √ Bert as service开源项目 |
---|---|---|
词向量与词嵌入 | 1) TFIDF2) Word2Vec算法3) Gensim模块4) Skip-gram5) TF代码实现Word2Vec算法项目6) FastText7) Word Embedding8) 深度学习用户画像项目 | |
循环神经网络原理与优化 | 1) Vanilla RNN2) Basic RNN实现MNIST手写数字图片识别3) LSTM长短时记忆4) GRU与双向LSTM5) 电影评论情感分析案例6) Seq2Seq7) 机器写唐诗案例8) CNN+LSTM+CRF9) POS tagging词性标注案例10) NER命名实体识别案例11) 孪生网络12) 语义相似度分析案例 | |
Transformer和Bert | 1) Attention注意力机制2) Attention算法流程3) Transformer4) Self-Attention机制5) Multi-Head Attention6) Bert7) Bert as service开源项目 |
第十三阶段:图像识别项目
项目名称 | 项目介绍 | 目标与收益 |
---|---|---|
电缆缺陷检测 | 各省市电网,需要建立一套完善的电缆线部件缺陷检测的平台,为各省市的电缆线部件缺陷提供智能化的解决方案,进一步确保电网系统的安全运行。现在有些省市的电网缺陷部件的检测仍采用人工查缺的方式,智能化的缺陷检测平台可以提高电缆线部件缺陷检测的准确率,节省成本。 | ◆ 课程目标:重点依托cascade R-CNN算法,以及mmdetection工具,完成整套从数据标注到模型训练、优化。◆ 课程收益:√ 对目标检测算法有一个很好的了解,重点掌握cascade R-CNN算法 √ 能够对mmdetection工具有一个很好的了解 √ 对数据打标签、数据集制作、算法模型训练有一个很好的掌握 √ 对mmdetection代码有一定了解,学会如何改进和优化算法 |
电子元件缺陷检测 | 在机器视觉应用中,外观检测一直是行业痛点。外观缺陷中的划痕、脏污、形态不一、大小不同、深浅和各种姿态都不同,很难用传统的视觉检测算法稳定检测。但是随着深度学习技术的发展,采用深度学习模式的外观检测程式,成为了外观检测的新方法。 | ◆ 课程目标:重点依托Faster R-CNN算法,以及TensorFlow工具,完成整套从数据标注到模型训练、优化。◆ 课程收益:√ 对目标检测算法有一个很好的了解,重点掌握Faster R-CNN算法 √ 对数据打标签、数据集制作、算法模型训练有一个很好的掌握 √ 对Faster R CNN代码有深刻认知,学会如何改进和优化算法 |
安全帽检测 | 施工工地对安全帽佩戴的检测和监管力度越来越大了,从智能安全帽的应用到安全帽检测系统的智能管理,现在的安全帽检测升级版对于安全帽佩戴标准也有了新的分析算法,对未正确佩戴、悬挂等都能准确检测识别。对工作服颜色接近安全帽颜色的检测能力有了更高的提升,比传统的安全帽识别系统精度更高。 | ◆ 课程目标:重点依托Yolo one stage算法,以及Darknet工具,完成整套从数据标注到模型训练、优化。◆ 课程收益:√ 对目标检测算法有一个很好的了解,重点掌握Yolo V3算法 √ 对数据打标签、数据集制作、算法模型训练有一个很好的掌握 √ 对Yolo V3代码有深刻认知,学会如何改进和优化算法 |
人脸识别 | 人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。 | ◆ 课程目标:通过一个完整的人脸识别项目,掌握人脸识别系统的开发流程和关键技术。◆ 课程收益:√ 从0到1,全面剖析完整项目整个建设生命周期:需求分析、架构设计、环境部署、程序设计、模型训练。 √ 掌握人脸识别一般过程,人脸检测、人脸对齐、人脸识别 √ 掌握人脸检测的集成学习方法 √ 掌握人脸检测的CNN方法 √ 掌握人脸检测+关键点定位的多任务网络MTCNN |
第十四阶段:自然语言处理项目
项目名称 | 项目介绍 | 目标与收益 |
---|---|---|
OCR识别 | OCR文字识别软件,指利用OCR (Optical Character Recognition,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本的软件。软件可以把图片转换成可以编辑的文字。从验证码、身份证识别、驾驶证识别、票据识别,到如今更多的识别自然场景下的整句话,甚至理解PDF里面带错别字的整段文字,应用场景可谓非常之广。 | ◆ 课程目标:掌握目标检测+RNN+CTC loss完成通用的深度学习OCR架构。◆ 课程收益:√ 了解OCR应用场景和概念 √ 掌握目标检测+RNN+CTC loss架构 √ 掌握CTC loss中的原理 √ 掌握深度学习训练OCR模型的整体流程和代码 |
实体关系抽取 | 实体关系抽取解决了原始文本中目标实体之间的关系分类问题,它也被广泛应用于文本摘要、自动问答系统、知识图谱、搜索引擎和机器翻译中。中文实体关系抽取由于中文句式和语法结构复杂,汉语有更多歧义,会影响关系分类的效果。 | ◆ 课程目标:对实体关系抽取技术、在行业应用有很清晰的认识。学会如果从语料库中通过机器学习和深度学习算法建立关系,服务于自动聊天机器人和知识图谱。◆ 课程收益:√ 了解任务是从无结构的文本中抽取实体以及实体之间的关系(实体1-关系-实体2,三元组),这里的关系是我们预定义好的关系类型。 √ 可以学到综合运用词嵌入、BiLSTM、CRF等NLP相关知识 |
自动聊天机器人 | 聊天机器人(Chatbot),又被称为对话代理(Conversational Agents)或对话系统(Dialog Systems),是当前的一个研究热点。Microsoft在聊天机器人领域下了巨大赌注,其他的公司,例如Facebook(M)、Apple(Siri)、Google、WeChat和Slack也不甘落后,推出了相关的产品。这股聊天机器人的新浪潮,也在一些创业公司兴起了:试图改变用户和服务之间的交互模式的产品。 | ◆ 课程目标:我们将会介绍用于搭建聊天机器人模型的深度学习技术,让同学对于“这个领域中,什么是能做到的,什么是现阶段几乎不可能实现的”有一个清晰的认知。并且学习搭建检索式聊天机器人和产生式聊天机器人。◆ 课程收益:√ 对智能问答技术会有很清晰的认识 √ 理解意图识别、实体关系抽取对Chatbot的作用 √ 可以学到一个聊天机器人项目实现 √ 了解聊天机器人现阶段面临的挑战 |
知识图谱 | 知识图谱的应用从最初的Google搜索,已经蔓延到了聊天机器人,大数据风控、投资、智能医疗、自适应教育、推荐系统、物联网等多个重要领域,并逐步成为不可缺少的一门人工智能技术。 | ◆ 课程目标:对知识图谱技术、行业应用有很清晰的认识。学到完整知识图谱项目全生命周期所涉关键问题的解决思路。◆ 课程收益:√ 对知识图谱技术、行业应用全貌会有很清晰的认识 √ 可以学到一个完整知识图谱项目全生命周期所涉及到的步骤 √ 对每个关键问题的解决思路 |
第十五阶段:数据挖掘项目
项目名称 | 项目介绍 | 目标与收益 |
---|---|---|
推荐系统 | 推荐系统在各种系统中广泛使用,推荐算法则是其中最核心的技术点, 为推荐系统选择正确的推荐算法是非常重要的决定。每一种推荐算法都有其优点和缺点,当然也有其限制条件,在作出决定之前,必须要一一考量。在实践中,你可能会测试几种算法,以发现哪一种最适合你的用户,学习中你也会直观地发现它们是什么以及它们的工作原理。 | ◆ 课程目标:掌握推荐系统原理与工作方式,使用SparkMLlib库进行建模。并且掌握更多推荐系统相关算法的运用。◆ 课程收益:√ 对推荐系统技术架构、行业应用全貌会有很透彻的理解 √ 掌握SparkMLlib、Hive数仓、python脚本的综合使用 √ 掌握GBDT+LR架构在推荐系统的运用 √ 掌握FM和FFM算法在推荐系统中的运用 √ 掌握深度学习推荐算法wide and deep learning |
智能商业分析 | 智能商业分析项目对于企业的盈利会起到非常直接的影响,会深入影响企业制定战略策略,也是很多企业非常看重的硬需求。成功案例比如,微博粉丝推广,宠物类目如何圈定投放人群,如何保持有效客户池,店铺营销,如何招揽客圈人,挖掘潜在人群,DMP帮我找到买面膜,ROI(投资回报率)翻倍,企业成本控制。 | ◆ 课程目标:全面了解智能商业的价值,了解运营的价值,挖掘深层次用户行为、消费能力、行业所需,结合机器学习算法和NLP知识进行数据挖掘◆ 课程收益:√ 掌握智能商业分析和运营的关系 √ 通过机器学习算法、分类、预测、深层次学习特征发现 √ 深入理解企业级用户画像系统 √ 基于画像系统提高公司的收益 √ 学会销售分析、投入分析、商品分析、促销分析、行为分析、CAC模型精准分析用户、ROI精准实现变现能力 |
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。