课程大纲

I. 引言和序言

1. 概述

  • 使 R 更友好,R 和可用的 GUI
  • 雷工作室
  • 相关软体和文件
  • R 和统计资讯
  • 以交互方式使用 R
  • 介绍性会议
  • 获取有关功能和特性的说明
  • R 命令、区分大小写等。
  • 调用和更正以前的命令
  • 从档案执行命令或将输出转移到档中
  • 数据持久性和删除物件
  • Good 程式设计实践:自包含脚本,良好的可读性,例如结构化脚本、文档、markdown
  • 安装套件;CRAN 和 Bio 导体

2. 读取数据

  • Txt 文件 (read.delim)
  • CSV 档

3. 简单的操作;数位和向量 + 阵列

  • 向量和赋值
  • 向量算术
  • 生成常规序列
  • 逻辑向量
  • 缺失值
  • 字元向量
  • 索引向量;选择和修改数据集的子集
    • 阵 列
  • 阵列索引。阵列的子节
  • 索引矩阵
  • array() 函数 + 对数位的简单操作,例如乘法、转置
  • 其他类型的物件

4. 列表和资料框

  • 清单
  • 构建和修改清单
    • 连接清单
  • 数据帧
    • 制作数据框
    • 使用数据框
    • 附加任意清单
    • 管理搜寻路径

5. 资料操作

  • 选择、子集化观测值和变数
  • 筛选、分组
  • 重新编码、转换
  • 聚合,组合数据集
  • 形成分区矩阵 cbind() 和 rbind()
  • 包含阵列的串联函数 ()
  • 字元操作、stringr 包
  • grep 和 regexpr 简介

6. 详细了解读取数据

  • XLS、XLSX 档
  • Readr 和 ReadXL 软体包
  • SPSS, SAS, Stata,...和其他格式数据
  • 将数据汇出为 txt、csv 和其他格式

6. 分组、循环和条件执行

  • 分组表达式
  • 控制语句
  • 条件执行:if 语句
  • 重复执行:for 回圈、repeat 和 while
  • apply、lapply、sapply、tapply 简介

7. 功能

  • 创建函数
  • 可选参数和预设值
  • 参数数量可变
  • 范围及其后果

8. R 中的简单图形

  • 创建图形
  • 密度图
  • 点图
  • 条形图
  • 折线图
  • 饼图
  • 箱线图
  • 散点图
  • 组合图

II. R 中的统计分析

1. 概率分布

  • R 作为一组统计表
  • 检查一组数据的分布

2. 假设检验

  • 关于总体均值的检验
  • 似然比检验
  • 单样本和双样本检测
  • 卡方 Go 拟合度检验
  • Kolmogorov-Smirnov 单样本统计量
  • Wilcoxon 符号秩检验
  • 双样本测试
  • Wilcoxon 秩和检验
  • Mann-Whitney 检验
  • Kolmogorov-Smirnov 测试

3. 假设的多重检验

  • I 型错误和 FDR
  • ROC 曲线和 AUC
  • 多种测试程式(BH、Bonferroni 等)

4. 线性回归模型

  • 用于提取模型资讯的通用函数
  • 更新拟合模型
  • 广义线性模型
    • 家族
    • glm() 函数
  • 分类
    • Logistic 回归
    • 线性判别分析
  • 无监督学习
    • 主成分分析
    • 聚类方法(k-means、层次聚类、k-medoids)

5. 生存分析(生存包)

  • r 中的生存物件
  • Kaplan-Meier 估计、对数秩检验、参数回归
  • 置信区间
  • 删失(区间删失)数据分析
  • Cox PH 模型,常数协变数
  • Cox PH 模型,瞬态协变数
  • 类比模型比较(比较回归模型)

6. 方差分析

  • 单因数方差分析
  • 方差分析的双向分类
  • 多元方差分析

三、生物资讯学中的工作问题

  • limma 包简介
  • 微阵列数据分析工作流程
  • 从 GEO 下载的数据:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • 资料处理(QC、归一化、差异表达)
  • 火山图
  • Custering 示例 + 热图
 28 小时

客户评论 (5)

即将举行的公开课程

课程分类