进入一个全新的领域之前,最好能够对这个领域的知识体系、技能模型有全面的了解,这样你能知道哪些是应该学习,哪些是暂时不用学的,知道什么样的路径适合自己的状况。
基于数据分析这个技能,DC 学院 —— 准备了一份『超级技能地图』,帮你快速认识数据分析的技能模块,以及不同的分支下,有哪些必备的技能,以及有哪些好用的资源。
这一张图,可以帮助你快速认识数据分析这个领域,即便你从未接触过相关的内容,也可以很清晰地建立数据分析知识框架。
这是数据分析小白必备的数据分析技能图,因为包含了 Python 数据分析全方位的技能体系,比如数据获取、SQL 数据库、Python、统计学、数据分析核心模块、可视化、报告撰写等等都有详细拆解。
高效的学习路径是什么?就是按这样的顺序循序渐进,你会知道每个部分需要完成的目标是什么,需要学习哪些知识点,哪些知识是暂时不必要的。
1. 数据获取
一般数据获取有内部和外部两种渠道,内部数据可以通过企业数据库提取,需要掌握 SQL 相关的技能。
外部数据则可以通过公开数据集和爬取网络数据实现,需要了解相关的数据开放站点,以及掌握必要的 Python 爬虫技能。

2. SQL 数据库
SQL 技能是数据分析师职位必备的技能之一,需要你对企业的数据库进行管理,能够正常地存储和提取数据。当然 SQL 需要掌握的技能并不难,了解基本的语法,掌握基本的增删改查就可以满足常规的需求了。

3. 数据分析必备统计学
如果说数据分析需要什么数学基础,那统计学应该是设计最多的了,但不需要非常深入,因为大多数数据分析用到的无非是统计量、数据分布等基础知识。

4. 数据分析必备 Python 基础
利用 Python 进行数据分析,那 Python 的基础就非常重要了,这意味着你后续是否能够正常地用 Python 代码来实现你的分析想法。
基本的编程规范、数据结构、自定义函数 、控制语句(条件语句、循环语句)、文件读写和模块使用都是需要重点掌握的点。

5. 数据分析核心工具
在 Python 数据分析的体系内,Numpy / Pandas / Matplotlib 三个核心库是绕不过去的。也是这三个工具,能够让你实现数据清洗、科学计算、数据分析、数据可视化等核心的工作。
掌握这些,你就完全可以去实现描述型数据分析、探索型数据分析,再加上 Sklearn,你可以去实现预测型数据分析,一个完整的数据分析项目,也不过云云。

6. 数据报告撰写
数据报告撰写虽然看起来像是文档整理类的工作,但也是非常重要的,因为直接决定了你最终的输出成果。
对于如何撰写一份优秀的数据报告,问题拆解的逻辑、数据指标的选取、用户受众需求的分析、图形化的呈现形式都是非常重要的点。
