课程大纲

  1. Machine Learning 引言
    • 机器学习的类型——监督学习与无监督学习
    • 从统计学习到机器学习
    • Data Mining 工作流:
      • Business 理解
      • 数据理解
      • 数据准备
      • 造型
      • 评估
      • 部署
    • 机器学习算法
    • 为问题选择适当的算法
    • ML 中的过拟合和偏差-方差权衡
  2. ML 库和编程语言
    • 为什么要使用编程语言
    • 在 R 和 Python 之间进行选择
    • Python 速成班
    • Python 资源
    • Python 机器学习库
    • Jupyter 笔记本和交互式编码
  3. 测试 ML 算法
    • 泛化和过拟合
    • 避免过拟合
      • 维持法
      • 交叉验证
      • Bootstrap平
    • 评估数值预测
      • 精度测量:ME、MSE、RMSE、MAPE
      • 参数和预测稳定性
    • 评估分类算法
      • 准确性及其问题
      • 混淆矩阵
      • 班级不平衡问题
    • 可视化模型性能
      • 利润曲线
      • ROC曲线
      • 提升曲线
    • 选型
    • 模型调优 – 网格搜索策略
    • Python 中的示例
  4. 数据准备
    • 数据导入和存储
    • 了解数据 – 基本探索
    • 使用 pandas 库进行数据操作
    • 数据转换 – 数据整理
    • 探索性分析
    • 缺失观测值 – 检测和解决方案
    • 异常值 – 检测和策略
    • 标准化、归一化、二值化
    • 定性数据重新编码
    • Python 中的示例
  5. 分类
    • 二元分类与多类分类
    • 通过数学函数进行分类
      • 线性判别函数
      • 二次判别函数
    • Logistic回归和概率方法
    • K - 最近邻
    • 朴素贝叶斯
    • 决策树
      • 装袋
      • Random Forest秒
      • 提高
      • Xgboost的
    • 支持向量机和内核
      • 最大边距分类器
      • 支持向量机
    • 集成学习
    • Python 中的示例
  6. 回归和数值预测
    • 最小二乘估计
    • 变量选择技术
    • 正则化和稳定性 - L1、L2
    • 非线性和广义最小二乘法
    • 多项式回归
    • 回归样条曲线
    • 回归树
    • Python 中的示例
  7. 无监督学习
    • 聚类
      • 基于质心的聚类 – k-means、k-medoids、PAM、CLARA
      • 分层聚类 – Diana, Agnes
      • 基于模型的聚类 - EM
      • 自组织地图
      • 集群评估和评估
    • 降维
      • 主成分分析和因子分析
      • 奇异值分解
    • 多维缩放
    • Python 中的示例
  8. 文本挖掘
    • 预处理数据
    • 词袋模型
    • 词干提取和词形还原
    • 分析词频
    • 情感分析
    • 创建词云
    • Python 中的示例
  9. 推荐引擎和协同过滤
    • 推荐数据
    • 基于用户的协同过滤
    • 基于项目的协同过滤
    • Python 中的示例
  10. 关联模式挖掘
    • 频繁项集算法
    • 市场篮子分析
    • Python 中的示例
  11. 异常值分析
    • 极值分析
    • 基于距离的异常值检测
    • 基于密度的方法
    • 高维异常值检测
    • Python 中的示例
  12. Machine Learning 案例研究
    • Business 问题理解
    • 数据预处理
    • 算法选择和调优
    • 对调查结果的评估
    • 部署

要求

对 Machine Learning 基础知识的知识和认识

 21 小时

客户评论 (3)

即将举行的公开课程

课程分类