课程大纲

Data Analysis 和 Big Data 简介

  • 是什么让 Big Data “大”?
    • 速度、体积、多样性、准确性 (VVVV)
  • 传统数据处理的限制
  • 分散式处理
  • 统计分析
  • Machine Learning 分析的类型
  • Data Visualization

Big Data 角色和职责

  • 管理员
  • 开发人员
  • 数据分析师

Languages 用于 Data Analysis

  • Python
    • 为什么 Python 为 Data Analysis?
    • 操作、处理、清理和处理数据

接近 Data Analysis

  • 统计分析
    • 时间序列分析
    • Forecasting 使用关联和回归模型
    • 推论 Statistics (估计)
    • Big Data 集合中的描述 Statistics (例如计算平均值)
  • Machine Learning
    • 监督学习与无监督学习
    • 分类和聚类
    • 估算特定方法的成本
    • 滤波

Big Data 基础设施

  • 数据存储
    • 关系资料库 (SQL)
      • MySQL
      • Postgres
      • Oracle
    • 了解细微差别
      • 分层资料库
      • 面向物件的资料库
      • 面向文件的资料库
      • 面向图形的资料库
      • 其他

Big Data 的未来

总结和后续步骤

要求

  • 对数学的一般理解
  • 对程式设计的一般理解
  • 对资料库的一般理解

观众

  • 开发人员/程式师
  • IT 顾问
 21 小时

客户评论 (5)

即将举行的公开课程

课程分类