课程大纲

介绍

  • 构建有效的模式识别、分类和回归算法。

设置开发环境

  • Python库
  • 线上与线下编辑器

特征工程概述

  • 输入和输出变量(特征)
  • 特征工程的优缺点

原始数据中遇到的问题类型

  • 数据不干净、数据缺失等。

变量预处理

  • 处理缺失数据

处理数据中的缺失值

处理分类变量

将标签转换为数字

处理分类变量中的标签

转换变量以提高预测能力

  • 数值、分类、日期等。

清理数据集

机器学习建模

处理数据中的异常值

  • 数值变量、分类变量等。

总结与结论

要求

  • 具备Python编程经验。
  • 熟悉Numpy、Pandas和scikit-learn。
  • 了解机器学习算法。

受众

  • 开发者
  • 数据科学家
  • 数据分析师
 14 小时

客户评论 (2)

即将举行的公开课程

课程分类