Python 知识卡片:Pandas

继续之前的《Python 知识卡片:数据科学入门》,Pandas 最初由 AQR Capital Management 于 2008 年 4 月开发,并于 2009 年底开源出来, 有 NumPy 的加持,让 Pandas 拥有了大量库和一些标准的数据模型,快速便捷地处理数据的函数和方法,可以让我们利用 Python 高效地操作大型数据集,使 Python 成为强大而高效的数据分析环境。Pandas 为了使实际的数据分析更加简单,设计出了快速、灵活而可读性高的数据结构。但可能对于那些刚刚接触 Pandas 的科研人员与学生来说,Pandas 并不是那么容易掌握,尤其是面对这个包里那么多的功能、[……]

继续阅读

Python 知识卡片:数据科学入门

这张由 Datacamp 制作的小抄表覆盖了所有 Python 数据科学需要的基础知识。如果你刚开始用 Python,可以留着这张做快速参考。背下这些小抄的代码变量、数据类型函数、字符串操作、类型转换、列表和常用操作。尤其是它列出了重要的 Python 包,给出了用于选择并导入包的小抄代码。查看这份小抄表,你将获得循序渐进学习 Python 的指导。同时,它提供了Python学习的必备包和一些有用的学习技巧等资源。Python 数据科学小抄表 PDF 下载。[……]

继续阅读

经济专业与经济计量学

经济专业的学生要分析统计资料,在标准的统计学课程中所学到的描述性统计,绝大多数学生无法用到实际经济分析中。经济学家发展出比较适用于分析经济资料的统计方法就是经济计量学。若想要比较深入的应用统计方法到经济学研究中,必须进一步学习经济计量学。

—— 原文作者:袁建文(广东财经大学经济学院)

一般人对经济学的直觉反应是:那是一个很高深的理论。然而我们也应该知道,经济学的研究虽然是从严谨抽象的理论出发,但因为研究对象是人的行为,经济学也必须相当“实际”,当我们评断经济理论是否成立时,当然是要看它符不符合人的行为。因此很大一部分经济学研究是以实际资料的观察和分析为中心的。经济专业学生必须有分析资料的[……]

继续阅读

YouTube 推荐算法透视

正如跨象乘云™ 的视频点播推荐系统大数据实训项目工程案例所描述,目前,算法已经成为驱动 YouTube 收入增长最有效的工具,使用神经网络通过大量数据和用户观看记录对用户进行分析,YouTube 的工程师将其描述为目前规模最大、最复杂的商用推荐系统。那这个推荐系统到底是怎么工作的呢?

本质上,过滤气泡(filter bubble,一种网站针对个人化搜索而提供筛选后内容的结果)的生成方式,也是所有推荐算法的工作原理。一小段电脑代码跟踪你正在进行的动作,比如你最常看的视频分类、最长观看时间,然后推荐给你同一类型的视频。内容推荐算法的过程一般包括以下三步:

  1. Item Represen[……]

    继续阅读

中国信通院《大数据白皮书(2018年)》

随着信息技术和人类生产生活交汇融合,全球数据呈现爆发增长、海量集聚的特点,对经济发展、社会治理、国家管理、人民生活都产生了重大影响。近年来,我国的大数据在政策、技术、产业、应用等方面均获得了长足发展。 本白皮书是继《大数据白皮书(2014年)》、《大数据白皮书(2016年)》之后中国信息通信研究院第三次发布大数据白皮书。本白皮书在前两版的基础上,集中梳理介绍了我国大数据的最新发展态势和成果。本白皮书首先对我国大数据的发展进行了回顾与梳理,对大数据发展的总体情况进行了研判。白皮书还对大数据的技术发展、行业应用进行了梳理,探讨了利用大数据提升政府治理能力的关键问题,并对数据法律法规体系和地方大数据[……]

继续阅读

NumPy 教程:基础知识

此前,跨象乘云™ 介绍了几篇关于 Python 《数据科学管道与数据分析库:Pandas》的教程,NumPy(Numerical Python)是 Python 中的一个线性代数库。对每一个数据科学或机器学习 Python 包而言,这都是一个非常重要的库,SciPy(Scientific Python)、Mat-plotlib(plotting library)、Scikit-learn 等都在一定程度上依赖 NumPy。对数组执行数学运算和逻辑运算时,NumPy 是非常有用的。在用 Python 对 N 维数组和矩阵进行运算时,NumPy 提供了大量有用特征。

这篇教程介绍了数据科学初[……]

继续阅读

使用 Bing 创建深度学习数据集

Adrian Rosebrock 像我们介绍了如何使用微软的 Bing Image Search API 来建立深度学习图像数据集。Bing Image Search API 是微软 Cognitive Services 的一个组成部分,主要是帮助用户在视觉、语言、文本等手机应用和软件中应用 AI。相比较,利用 Google Images 来构建自己的数据集是一个乏味且需要手动的过程,主要原因是因为多年前,谷歌关停了自己的图像搜索 API ,然而,我们需要的是一个通过查询能够自动下载图像的方案。这里是本文的完整翻译,同时,跨象乘云™ 为你提供了 Adrian Rosebrock 编写的《图像搜[……]

继续阅读

人工智能 DIY 套件:用硬纸板打造你自己的智能硬件

大大小小的科技公司纷纷加入 AI 的潮流,但这次有充分的理由。人工智能和机器学习是未来技术不可或缺的组成部分,可能会带给我们现在无法想象的计算机功能。而谷歌已经发现了一个新角色,为新兴工程师配备他们需要了解的 AI 工具并构建他们自己的 AI 解决方案。不,这不是机器人革命的开始。这是 Google 新的 “AIY” 计划的开始,它将为想要试验和了解不同 AI 解决方案的人们(主要是学生)提供全面的 DIY 套件。

Google 正在采取多项步骤中的第一步,帮助教育工作者将 AIY 集成到 STEM 课程计划中,并通过推出新版 AIY 工具包,帮助学生应对未来挑战 ——

语音套件[……]

继续阅读

AI 语义技术体验

近日,Google AI 研究机构发布了一款基于人工智能的搜索引擎,该实验项目可以让普通人也能感受最新语义理解和自然语言处理技术的强大能力:它们是目前人工智能技术发展的重要方向。值得一提的是,《奇点临近》一书的作者,谷歌研究院工程总监雷·库兹韦尔也参与了这一工作。Semantic Experiences 网站上有两个示例,展示了这些新的方法如何驱动之前不可能的应用。Talk to Books 是一种探索书籍的全新方式,它从句子层面入手,而不是作者或主题层面。Semantris 是一个由机器学习提供支持的单词联想游戏,你可以在其中键入与给定提示相关联的词汇。此外,谷歌还发布了论文《Univers[……]

继续阅读

教育部印发《高等学校人工智能创新行动计划》

教育部日前印发《高等学校人工智能创新行动计划》(以下简称《计划》)的通知。

《计划》指出,人工智能的迅速发展将深刻改变人类社会生活、改变世界。为贯彻落实《国务院关于印发新一代人工智能发展规划的通知》和 2017 年全国高校科技工作会议精神,引导高校瞄准世界科技前沿,强化基础研究,实现前瞻性基础研究和引领性原创成果的重大突破,进一步提升高校人工智能领域科技创新、人才培养和服务国家需求的能力,特制定本行动计划。

《计划》要求,引导高校瞄准世界科技前沿,强化基础研究,实现前瞻性基础研究和引领性原创成果的重大突破,进一步提升高校人工智能领域科技创新、人才培养和服务国家需求的能力,支持高校在[……]

继续阅读