课程大纲

Machine Learning

介绍Machine Learning

  • 机器学习的应用
  • 监督学习和非监督学习
  • 机器学习算法
    • 回归
    • 分类
    • clustering
    • 推荐系统
    • 异常检测
    • Reinforcement Learning

回归

  • 简单回归和多重回归
    • 最小平方法
    • 估计系数
    • 评估系数估计的准确性
    • 评估模型的准确性
    • 后估计分析
    • 回归模型中的其他考虑因素
    • 定性变量
    • 线性模型的扩展
    • 潜在问题
    • 回归模型的偏差方差权衡 (under-fitting/over-fitting)

重取样方法

  • 交叉验证
  • 验证集方法
  • 留一交叉验证
  • k 折交叉验证
  • k 折的偏差-方差权衡
  • The Bootstrap

模型选择和正则化

  • 子集选择
    • 最佳子集选择
    • 逐步选择
    • 选择最佳模型
  • 收缩方法/正则化
    • 脊回归
    • 套索和弹性网
  • 选择调优参数
  • 降维方法
    • 主成分回归
    • 偏最小平方

分类

逻辑回归

  • 逻辑模型成本函数
  • 估计系数
  • 做出预测
  • 赔率比
  • 性能评估矩阵
    • 敏感性/特异性/PPV/NPV
    • 精度
    • ROC 曲线
  • 多元逻辑回归
  • 针对 >2 响应类别的逻辑回归
  • 正则化逻辑回归

线性判别分析

  • 使用贝叶斯定理进行分类
  • p=1 的线性判别分析
  • p>1 的线性判别分析

二次判别分析

K 最近邻

  • 具有非线性决策边界的分类

支持向量机

  • 优化目标
  • 最大边际分类器
  • 内核
  • 一对一分类
  • 一对全分类

分类方法的比较

Deep Learning

Deep Learning简介

人工Neural Networks(ANN)

  • Bio逻辑神经元和人工神经元
  • 非线性假设
  • 模型表示
  • 范例和直觉
  • 转移函数/激活函数
  • 网络架构的典型类别
    • 前馈ANN
    • 多层前馈网络
  • 反向传播算法
  • 反向传播 - 训练和收敛
  • 用反向传播进行的功能逼近
  • 反向传播学习的实际问题和设计问题

Deep Learning

  • 人工智能和Deep Learning
  • Softmax 回归
  • 自学习
  • 深网络
  • 演示和应用

实验室:

R 语言入门

  • R 语言介绍
  • 基本命令和库
  • 数据操作
  • 导入和导出数据
  • 图形和数值总结
  • 编写函数

回归

  • 简单和多元线性回归
  • 交互作用项
  • 非线性变换
  • 虚拟变量回归
  • 交叉验证和Bootstrap
  • 子集选择方法
  • 惩罚(Ridge、Lasso、Elastic Net)

分类

  • 逻辑回归、LDA、QDA 和 KNN
  • 重取样和正则化
  • 支持向量机

注意:

  • 对于 ML 算法,将使用案例研究来讨论它们的应用、优势和潜在问题。
  • 将使用 R 对不同数据集进行分析。

要求

  • 统计概念的基本知识是可取的

受众

  • 数据科学家
  • 机器学习工程师
  • 对 AI 感兴趣的软件开发人员
  • 从事数据建模的研究人员
  • 寻求在商业或行业中应用机器学习的专业人员
 21 小时

客户评论 (6)

即将举行的公开课程

课程分类