LSTM:时间序列数据关联模型

此前,跨象乘云™介绍了《LSTM 模型预测电子货币价格》教程,实际上,LSTM 模型能够从时间序列数据中捕捉最重要的特征并进行关联建模。股票价格预测模型,是关于对冲基金如何使用此类系统的典型案例,使用了 Python 编写的 PyTorch 框架进行训练,设计实验并绘制结果。

对冲基金是深度学[……]

继续阅读

2018《大数据标准化白皮书》

3 月 29 日,由中国电子技术标准化研究院主编的《大数据标准化白皮书(2018 版)》正式发布。在国家大数据战略的推进实施下,我国大数据政策体系日臻完善,作为产业统筹布局的重要支撑,大数据标准的技术支撑和引领作用进一步凸显。

《白皮书》立足于大数据产业发展的社会转型历史时期所具有的政策、经济[……]

继续阅读

Google 开源 FHIR 医疗数据模型

Google 正在大力推动 FHIR 进行医疗预测。在过去 10 年间,医疗数据已经从以纸质文件为主几乎完全数字化为电子健康记录。但是,理解这些数据涉及一些关键挑战。

  1. 供应商之间没有共同的数据表示形式;每个供应商都使用不同的方式来构建他们的数据。
  2. 即使使用相同供应商的网站也可能存在很[……]

    继续阅读

Pandas 教程:优化运算

当科研项目达到使用 100 多 TB 生物数据规模的时候,数据科学库的一些局限性会先露出来。面临这种规模的数据时,Pandas 成了最受喜爱的工具;然而,当你开始处理 TB 级别的基因数据时,单核运行的 Pandas 就会变得捉襟见肘。如果我们拥有更多的处理器核,或者要打开数十 TB 规模的文件时,[……]

继续阅读

置信区间与置信度

TowardsDataScience 的作者 Dima Shulga,采用实例解释了统计学中的置信区间与置信度的概念。同时,机器之心做了全文的翻译。

本文讨论了统计学中的一个基本术语 :置信区间。我们仅以一种非常友好的方式讨论一般概念,没有太多花哨的统计术语,同时还会使用 Python 完成简[……]

继续阅读

Reticulate:R + Python 实现互操作

R 语言和 Python 已成为数据科学科研工作人员的标准配置。现在,对于数据科学科研人员而言,R 语言Python 终于不再是一个二选一的方案。CRAN 已于2018年3月21日收录 reticulat 包(1.6版本),它包含了用于 Python 和 R 之间协同操作的全套工具,在 R 和[……]

继续阅读

R + Python 预测工具:Prophet

Prophet 是由 Facebook 开源一款基于 PythonR 语言的数据预测工具,相比现有预测工具更加人性化,并且难得地提供 Python 支持。对于高等院校开设数据科学与大数据技术专业而言,通常纠结于应该采用 R 语言还是 Python 作为数据分析专业核心课程的主要工具 —— 某些[……]

继续阅读

Python 公开入门书籍

如何快速熟悉 Python 编程一直是很多初学者的疑问,我们经常考虑要不要系统地从头开始啃 Python 教程,但这种方法不仅非常枯燥且很难坚持。因此,对于很多入门读者,更好的方式是学习基础的 Python 编程,然后在实践中完善代码技巧。本文介绍了一本非常精炼的 Python 免费书籍,它不仅有基[……]

继续阅读

GitHub 开发者使用指南

GitHub 是一个拥有数十亿行代码的网站,每天有数百万开发者聚集在一起,与开源软件进行协作和报告问题。简而言之,它是一个基于 Git 构建的软件开发人员的平台。作为开发人员,编程专业学生,科研人员,几乎每天都要在工作中使用 GitHub 或其他基于 Git 的工具。用于托管代码或协作其他人的代码。[……]

继续阅读

卷积目标检测架构选型指南

架构及硬件选型一直是深度学习与新一代人工智能科研工作面临的第一个难题,本白皮书的目标正是一份作为选择能够为给定应用程序和平台实现正确速度/内存/精度平衡的检测架构的指南。为此,该团队研究了在现代卷积目标检测系统中交换速度和内存使用的准确性的各种方法。近年来已经提出了许多成功的系统,但是由于不同的基本[……]

继续阅读