数据可视化指南

今天分享一份谷歌数据可视化团队形成的一套全面的数据可视化指南, 涵盖了设计原则、图表分类、图表的选用、样式设计、交互设计、仪表板设计等方面。

数据可视化

数据可视化就是用图形描绘信息。

原则

数据可视化是一种以图形描绘密集和复杂信息的表现形式。数据可视化的视觉效果旨在使数据容易对比,并用它来讲故事,以此来帮助用户做出决策。

数据可视化可以表达不同类型和规模的数据,包括从几个数据点到有大量变量的数据集。

类型

数据可视化可以以不同的形式表达。图表是表达数据的常用方式,因为它们能够展示和对比多种不同的数据。图表类型的选择主要取决于两点:要表现的数据和表现该数据的用意。该指南描[……]

继续阅读

《大数据白皮书(2020年)》

2020 年 12 月 18 日,由中国信息通信研究院(以下简称“中国信通院”)、中国通信标准化协会大数据技术标准推进委员会主办的:2020 数据资产管理大会,在京召开。会上,中国信通院发布《大数据白皮书(2020年)》。这是中国信通院第五次发布大数据白皮书。白皮书在此前四版的基础上,回顾了去年以来大数据各领域的最新进展,并对“十四五”期间大数据的发展趋势进行了展望。

相关链接:《大数据白皮书(2019年)》[……]

继续阅读

大数据如何变革医疗保健行业

医疗保健行业在不断创造奇迹。无论是让盲人重见光明,帮助瘫痪的人恢复行动能力,还是进行基因重组以避免疾病,如今的医生正以新的方式拯救生命,改善人们的生活。这些戴着听诊器、穿着实验服的天才为整个社会带来福祉。

尽管已取得较大进步,医疗保健行业仍在努力试图解答一些颇为迫切的问题。如何帮助更多人活得更长寿、更健康?如何遏制飞涨的医疗保健费用?在数据泄露经常发生的时代,如何保护大量的个人信息和病历?

斯坦福大学的研究人员指出,答案在于对这个行业产生的大量数据进行处理,然后利用这些数据解决问题。 斯坦福大学的研究人员分析了大数据的需求、潜能和能力,并在题为《在医疗行业利用数据的力量》 (Har[……]

继续阅读

MIT 数据分析工具教程

这门课是 MIT 商业分析(BA)硕士项目的必修课,主要讲解了目前常用的一些数据分析工具,包括用 SQL 进行数据检索,用 Python,R 进行数据操作以及数据可视化和 git 和 Bash 的使用。

另外,MIT 老师还在自己的网站上给了这门课的文字教程和相关资料,非常适合大家学习。[……]

继续阅读

2020 年数据与分析领域的十大技术趋势

近日,Gartner 发布了数据与分析领域的十大技术趋势,为数据和分析领导者的新冠疫情(COVID-19)响应和恢复工作提供指导,并为疫情后的重启做好准备。数据和分析领导者如果希望在疫情后能持续创新,就需要不断提高数据处理和访问的速度,扩大分析规模,在前所未有的市场动荡中赢得成功。

数据和分析领导者应检验以尝试以下十大数据和分析趋势,加快新冠疫情后的恢复:

趋势1:更智能、更高速、更负责的 AI

到 2024 年底,75% 的企业机构将从人工智能(AI)试点转为AI运营,基于流数据的分析基础架构的数量将因此增加 5 倍。疫情当前,机器学习(ML)、优化和自然语言处理(NLP)等 AI[……]

继续阅读

Jupyter 可视化 Debug 工具

Jupyter 也能做可视化 Debug 了,Jupyter 团队发布第一个 Debug 插件与内核。虽然这只是第一版,但目前已经可以设置常见的断点 Debug,查看各种变量、执行模块等信息。

Python 代码编辑器怎么选?PyCharm、VS Code、Jupyter Notebook 都各有特色,Jupyter 适合做数据分析这些需要可视化的操作,PyCharm 更适合做完整的 Python 项目。然而,因为交互式操作,很少会有开发者想到用 Jupyter 做 Debug。

尽管很多读者可能认为 Jupyter 用来做展示和小型试验就足够了,Debug 并没有太大的需[……]

继续阅读

工业数据采集产业研究报告

国务院《关于深化“互联网+先进制造业”发展工业互联网的指导意见》明确将构建网络、平台、安全三大功能体系作为其重点任务,并指出要“强化复杂生产过程中设备联网与数据采集能力,实现企业各层级数据资源的端到端集成”。其中工业互联网平台是工业互联网体系架构的核心,而工业数据采集则是工业互联网平台的基础。在工业和信息化部信息化和软件服务业司的指导下,工业互联网产业联盟组织编写了《工业数据采集产业研究报告》,希望加强研究与交流,与业界共同推动工业数据采集的发展。

原文链接[……]

继续阅读

工业互联网白皮书系列下载(9本)

4 月 23 日,中国信息通信研究院(简称中国信通院)发布了近期工业互联网领域的重大科研成果 —— 9本白皮书!

1、《工业互联网体系架构》版本 2.0

本报告主要分为八个部分。第一部分介绍了工业互联网的内涵与意义。第二部分回顾了体系架构 1.0 版本,并介绍 2.0 版本的定位与作用。第三部分明确工业互联网体系架构 2.0 的设计方法论,剖析工业互联网体系架构 2.0 的整体视图。第四部分深入分析工业互联网体系架构 2.0 的业务视图,并给出产业、企业、工厂等不同层面业务目标与应用方向。第五部分剖析工业互联网体系架构 2.0 的功能架构,探究网络、平台、安全三大体系的功能视图、现状分析、[……]

继续阅读

新冠病毒数据分析过程中的数据科学基础知识

同步发布地址

本文转载自:大数据文摘 | BigDataDigest;结合跨象乘云™ 原创发布的:新冠病毒(COVID-19)数据分析系列视频,对新冠病毒数据分析过程中的数据科学基础知识和思维模型,进行清洗的脉络梳理与补充。

山川异域,风月同天。在全球蔓延的新型冠状病毒肺炎,已成为全世界关注的焦点,全球数据科学家,人工智能专业团队,都在通过不同的途径,从不同的角度支援这场全人类的『抗疫』战争,包括:对新冠疫情趋势进行分析和预测;对病毒基因进行解构,加速疫苗研发;对肺炎病患 X 光片进行智能甄别;对行人是否佩戴口罩进行识别。跨象乘云™ 专门开辟了针对新冠病毒(COVID-19)的数据[……]

继续阅读