课程大纲

Day One:语言基础

  • 课程介绍
  • 关于 Data Science
    • Data Science 定义
    • 做的过程 Data Science。
  • 简介 R Language
  • 变数和类型
  • 控制结构 (Loops / Conditionals)
  • R Scalars、向量和矩阵
    • 定义 R 向量
    • 预科
  • 字串和文本操作
    • 字元数据类型
    • 档IO
  • 清单
  • 功能
    • 函数介绍
    • 闭包
    • lapply/sapply 函数
  • 数据帧
  • 所有部分的实验室

第二天:中级 R Programming

  • 数据帧和文件 I/O
  • 从文件中读取数据
  • 数据准备
  • 内置数据集
  • 可视化
    • 图形包
    • plot() / barplot() / hist() / boxplot() / scatter plot
    • 热图
    • ggplot2 包 (qplot(), ggplot())
  • 使用 Dplyr 进行探索
  • 所有部分的实验室

第3天:高级 Programming 与 R

  • 使用 R 进行统计建模
    • 统计函数
    • 处理 NA
    • 分布(Binomial、Poisson、Normal)
  • 回归
    • 线性回归介绍
  • 推荐
  • 文本处理(tm 包 / Wordclouds)
  • 聚类
    • 聚类介绍
    • KMeans
  • 分类
    • 分类介绍
    • 朴素贝叶斯
    • 决策树
    • 使用 caret 包进行训练
    • 评估算法
  • R 和 Big Data
    • 将 R 连接到数据库
    • Big Data 生态系统
  • 所有部分的实验室

要求

  • 有基本程式设计背景者优先
  • 最新的R studio 和 R环境已安装
 21 小时

客户评论 (7)

即将举行的公开课程

课程分类