数据分析技能全流程知识细节

进入一个全新的领域之前,最好能够对这个领域的知识体系、技能模型有全面的了解,这样你能知道哪些是应该学习,哪些是暂时不用学的,知道什么样的路径适合自己的状况。

基于数据分析这个技能,DC 学院 —— 准备了一份『超级技能地图』,帮你快速认识数据分析的技能模块,以及不同的分支下,有哪些必备的技能,以及有哪些好用的资源。

这一张图,可以帮助你快速认识数据分析这个领域,即便你从未接触过相关的内容,也可以很清晰地建立数据分析知识框架。

这是数据分析小白必备的数据分析技能图,因为包含了 Python 数据分析全方位的技能体系,比如数据获取、SQL 数据库、Python、统计学、数据分析核心模块、可视化、报告撰写等等都有详细拆解。

高效的学习路径是什么?就是按这样的顺序循序渐进,你会知道每个部分需要完成的目标是什么,需要学习哪些知识点,哪些知识是暂时不必要的。

1. 数据获取

一般数据获取有内部和外部两种渠道,内部数据可以通过企业数据库提取,需要掌握 SQL 相关的技能。

外部数据则可以通过公开数据集和爬取网络数据实现,需要了解相关的数据开放站点,以及掌握必要的 Python 爬虫技能。

数据获取
数据获取

2. SQL 数据库

SQL 技能是数据分析师职位必备的技能之一,需要你对企业的数据库进行管理,能够正常地存储和提取数据。当然 SQL 需要掌握的技能并不难,了解基本的语法,掌握基本的增删改查就可以满足常规的需求了。

SQL 数据库
SQL 数据库

3. 数据分析必备统计学

如果说数据分析需要什么数学基础,那统计学应该是设计最多的了,但不需要非常深入,因为大多数数据分析用到的无非是统计量、数据分布等基础知识。

数据分析必备统计学
数据分析必备统计学

4. 数据分析必备 Python 基础

利用 Python 进行数据分析,那 Python 的基础就非常重要了,这意味着你后续是否能够正常地用 Python 代码来实现你的分析想法。

基本的编程规范、数据结构、自定义函数 、控制语句(条件语句、循环语句)、文件读写和模块使用都是需要重点掌握的点。

数据分析必备 Python 基础
数据分析必备 Python 基础

5. 数据分析核心工具

在 Python 数据分析的体系内,Numpy / Pandas / Matplotlib 三个核心库是绕不过去的。也是这三个工具,能够让你实现数据清洗、科学计算、数据分析、数据可视化等核心的工作。

掌握这些,你就完全可以去实现描述型数据分析、探索型数据分析,再加上 Sklearn,你可以去实现预测型数据分析,一个完整的数据分析项目,也不过云云。

数据分析核心工具
数据分析核心工具

6. 数据报告撰写

数据报告撰写虽然看起来像是文档整理类的工作,但也是非常重要的,因为直接决定了你最终的输出成果。

对于如何撰写一份优秀的数据报告,问题拆解的逻辑、数据指标的选取、用户受众需求的分析、图形化的呈现形式都是非常重要的点。

数据报告撰写
数据报告撰写