课程大纲

介绍

  • 定义“工业级自然语言处理”

安装 spaCy

spaCy 元件

  • 词性标注器
  • 命名实体识别器
  • 依存句法分析器

spaCy 功能和语法概述

了解 spaCy 建模

  • 统计建模与预测

使用 SpaCy 命令列介面 (CLI)

  • 基本指令

创建一个简单的应用程式来预测行为

训练新的统计模型

  • 数据(用于训练)
  • 标签(标记、命名实体等)

载入模型

  • 随机排列与循环

保存模型

向模型提供反馈

  • 误差梯度

更新模型

  • 更新实体识别器
  • 使用基于规则的匹配器提取词元

为预期结果发展广义理论

个案研究

  • 区分产品名称与公司名称

优化训练数据

  • 选择代表性数据
  • 设置丢弃率

其他训练方式

  • 传递原始文本
  • 传递注释字典

使用 spaCy 预处理 Deep Learning 的文字

将 spaCy 与传统应用程式整合

测试和调试 spaCy 模型

  • 迭代的重要性

将模型部署到生产环境

监视和调整模型

故障排除

总结和结论

要求

  • Python 编程经验。
  • 对统计学有基本了解
  • 具有命令行操作经验

观众

  • 开发者
  • 数据科学家
 14 小时

客户评论 (5)

即将举行的公开课程

课程分类