Spark 玩转 TensorFlow 2.0

大数据深度学习逐步成为研究的主流趋势。这是《30 天吃掉那只 TensorFlow2.0》里面的其中一篇,介绍在 Spark 中调用训练好的 TensorFlow 模型进行预测的方法。本篇文章通过 TensorFlow for Java 在 Spark 中调用训练好的 TensorFlow 模型。利用 Spark 的分布式计算能力,从而可以让训练好的 TensorFlow 模型在成百上千的机器上分布式并行执行模型推断。

本案例以 TensorFlow 2.0 的 tf.keras 接口训练的线性模型为例进行演示。在本例基础上稍作修改则可以用 Spark 调用训练好的各种复杂的神经网络模型[……]

继续阅读

用 Jupyter Notebook 制作新冠病毒疫情追踪器

『山川异域,风月同天』—— 新冠肺炎疫情牵动着举国上下的心,包括跨象乘云™ 在内,众多高科技企业除了向灾区捐赠物资,配合疫情防控工作,延期复工 / 远程办公的同时,也在积极探索如何利用大数据、新一代人工智能等新技术为『战疫』助力。

新冠肺炎已在全球范围内爆发。为了解全球疫情分布情况,日前,一位名叫 Michael Freeborn 的医生 / 程序员,利用 Python 的图形库 Plotly,制作了两种疫情的等值线地图(Choropleth Chart)和 GEO 分布散点图(”Scatter-Geo” Chart)。前者显示了一个国家 / 地区的疫情扩散情况:该国家 / 地区的在地图[……]

继续阅读

超轻量级中文 OCR

光学字符识别(OCR)技术已经得到了广泛应用。比如发票上用来识别关键字样,搜题 App 用来识别书本上的试题等。近期,这个叫做 chineseocr_lite 的 OCR 项目开源了,这是一个超轻量级中文 OCR 实现中文自然场景文字检测及识别。该项目支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅 17M。

GitHub地址项目 GitHub 地址[……]

继续阅读

fast.ai 面向 Pytorch 的深度学习新书开源

fast.ai 的创始人、前 Kaggle 首席科学家 Jeremy Howard 教授在 Github 上开源了和 Sylvain Gugger 合著的新书《Deep Learning for Coders with fastai and PyTorch》的初稿。全书草稿已公布 22 章,通过这份它你将学到:

  • 如何在计算机视觉、自然语言处理、推荐系统、表格和时间序列数据分析中创建最先进的模型
  • 如何使用全新的 fastai v2 库和 PyTorch
  • 深度学习的基础:什么是神经网络,它们是如何训练的,以及它们如何进行预测
  • 为什么以及如何使用深度学习模型,以及如何使用[……]

    继续阅读

《模式识别与机器学习 – PRML》中文版

日前,微软剑桥研究院公布了一个好消息,Christopher Bishop 所著的,最经典的机器学习教科书之一:《模式识别与机器学习》(Pattern Recognition and Machine Learning),公开了免费的 PDF 版本。这本经典的教科书全面介绍了模式识别和机器学习领域。它面向高年级本科生或一年级博士生,以及研究人员和从业人员。这是第一本机器学习教科书,全面包含该领域近期发展,包括概率图形模型和确定性推理方法,并强调现代贝叶斯。它适用于机器学习,统计学,计算机科学,信号处理,计算机视觉,数据挖掘和生物信息学等课程。该书出版于 2006 年,共有 738 页,全彩印刷,[……]

继续阅读

NumPy 中文官方教程

此前,跨象乘云 发布了《NumPy 教程:基础知识》与《Python 知识卡片:NumPy》两份教程。近日,NumPy 官方正式推出了 NumPy 中文版网站,涵盖 NumPy 的一切。在 Github 上一度蝉联最流行的机器学习和数据科学包 NumPy,已经有了非常之系统的中文文档。现在,如果有什么和 NumPy 的问题,只需要浏览这份官方中文文档就足够了。它足够的系统、全面且亲民。NumPy 是使用 Python 进行科学计算的基础软件包,是 Python 生态系统中数据分析、机器学习、科学计算的主力军,极大简化了向量与矩阵的操作处理。除了计算外,它还包括了:

Google 开源实时 3D 目标检测模型

Google AI 今天发布的 MediaPipe Objectron,一个可以实时 3D 目标检测的 pipeline。此前,跨象乘云™ 介绍过:MediaPipe 是一个开源的多媒体机器学习模型应用跨平台框架,用于构建 pipeline 来处理不同模式的感知数据。更为难得的,是基于MediaPipe 的 Objectron 直接支持在移动设备上实时计算面向对象的 3D 边界框。

GitHub地址项目 GitHub 地址[……]

继续阅读

新冠肺炎开放知识图谱数据集更新

『山川异域,风月同天』—— 新冠肺炎疫情牵动着举国上下的心,包括跨象乘云™ 在内,众多高科技企业除了向灾区捐赠物资,配合疫情防控工作,延期复工 / 远程办公的同时,也在积极探索如何利用大数据、新一代人工智能等新技术为『战疫』助力。

此前,跨象乘云™ 发布了《新型冠状病毒肺炎特征分析数据》。另外,OpenKG 联合国内多家科研机构,发布了《新冠肺炎开放知识图谱数据集》以及《新冠肺炎开放知识图谱数据集 – Ver 1.1。近日,OpenKG 继续更新发布多个新冠知识图谱数据集,其中包括哈尔滨工业大学构建的新冠概念图谱,武汉科技大学与东南大学联合构建的新冠防控图谱。同时,更新了由 IBM 中[……]

继续阅读

如何高效搜索 GitHub 开源项目

在互联网信息时代,知识搜索能力已成为个人成长的一个重要维度,搜索引擎本身是公开的,每个人都可以使用,然而真正了解如何高效应用搜索功能的却不多。跟大部分网站一样,GitHub 搜索入口很简单,都只有一个对话框。然而,正如只有你先提出了正确的问题,才能获得正确的答案。换句话说:你需要了解如何更好的输入你的搜索内容,才能更快的定位你需要寻找的资源。大部分人使用搜索引擎,都是简单的输入搜索内容。而搜索引擎的反馈也很纯粹 —— 你希望了解一切,我就告诉你我能搜索出来的一切,结果是你因为被海量信息淹没而什么都得不到。其实,无论是使用搜索引擎还是 GitHub,高效精准的获取搜索目标的秘密在于:使用『关键字[……]

继续阅读

CVPR 2020 论文及开源项目汇总

日前,CVPR 2020 中选论文正式放榜,跨象乘云™ 为您带来了相关论文及对应开源项目的代码汇总项目 —— CVPR 2020 论文开源项目合集。该项目完整覆盖了新一代人工智能科研在:图像分类、目标检测、3D 目标检测、目标跟踪、语义分割、实例分割、视频目标分割、NAS、GAN、Re-ID、3D 点云、人脸检测、活体检测、人脸表情识别、人体姿态估计、场景文本检测、场景文本识别、模型剪枝、行为识别、人群计数、深度估计、视觉问答、视觉语言导航、视频压缩、行为轨迹预测、数据集等方面的多领域应用。

GitHub地址项目 GitHub 地址[……]

继续阅读