您将会学习:
- 使用数据科学原理解决业务问题。
- 提取、转换和加载数据以及分析数据。
- 设计机器学习方法。
- 开发分类、回归、预测和聚类模型,并能展示、部署、监控模型。
课程背景:
今天,数据已经成为新的金矿。谁能从数据中挖掘出业务洞察力,谁就取得了竞争的优势。因此企业需要一支强大的数据专业人员队伍,能够在有效且可重复的流程框架内分析、理解、操作和呈现数据,从而为决策和日常运营来提供关键信息。
课程简介:
本课程帮助您掌握前沿的数据科学概念并能够付诸实践,从而为业务带来价值。本课程包括每个主题领域的实践活动。完成课程学习后您将具备通过运用数据科学技术以解决业务问题的实际能力。
课程目标:
- 使用数据科学原理解决业务问题。
- 应用提取、转换和加载(ETL)过程来准备数据集
- 使用多种技术分析数据并提取有价值的见解
- 设计一种机器学习方法来解决业务问题。
- 训练、调整和评估分类模型。
- 训练、调整和评估回归和预测模型。
- 训练、调整和评估聚类模型。
- 向受众展示模型,部署模型和监控模型性能。
谁应当参加:
本课程专为利用数据解决业务问题的专业技术人员而设计。包括数据分析相关的软件开发工程师、数据分析师或其他需要通过数据获得业务洞察力的专业人士,如数据产品经理、策略产品经理、运营经理等。
预备知识:
- 基本的数据科学概念,如:数据类型、数据科学角色、整体的数据科学生命周期等。
- 有Python等高级编程语言的经验。能够熟练地使用基本的Python数据科学库,如NumPy和pandas。
- 有使用数据库的经验,包括查询SQL等语言。
课程大纲:
1、如何运用数据科学解决业务问题
- 启动数据科学项目
- 制定数据科学问题
2、提取、转换和加载数据
- 提取数据
- 转换数据
- 加载数据
3、分析数据
- 检查数据
- 探索数据的潜在分布
- 使用可视化分析数据
- 预处理数据
4、设计机器学习方法
- 识别机器学习概念
- 检验假设
5、开发分类模型
- 训练和调整分类模型
- 评估分类模型
6、开发回归模型
- 训练和调整回归模型
- 评估回归模型
7、开发聚类模型
- 训练和调整聚类模型
- 评估聚类模型
8、完成数据科学项目
- 向利益相关者提交结果
- 在Web应用程序中演示模型
- 实施和测试
课时:
5天。