CNN 101:卷积神经网络的交互式视觉学习

为了应对深度学习模型中的复杂性挑战,日前,佐治亚理工学院研究人员开发了 CNN 101,这是另一个交互式的可视化卷积神经网络系统,可以帮助深度学习、人工智能实验室的科研人员以及学生更好地了解和学习卷积神经网络,它是基础的深度学习模型体系结构。

交互式可视化卷积神经网络系统
CNN 101 :交互式可视化卷积神经网络系统

使用现代 Web 技术构建的 CNN 101 无需专用硬件即可在用户的 Web 浏览器中本地运行。通过紧密集成的交互式视图,CNN 101 通过解释单神经元级别以及层级别的卷积,激活和池化操作,提供了模型工作方式的概述和详细说明。CNN 101 进一步扩大了公众对深度学习技术的教育途径。它应用了交互式可视化技术,为用户提供了一种更简单的方法来学习深度学习机制并建立神经网络直觉。并且,对于现有的通过交互式可视化来解释复杂机器学习算法的研究工作,CNN 101 可以与他们结合在一起。

同时,作者为 CNN 101 录制了演示视频,为了方便观看,跨象乘云™ 提供了源视频下载 ——

Python 知识卡片完整中文版

此前,跨象乘云™ 发布了一系列 Python 数据科学核心库的多份知识卡片,包括 ——

此前的知识卡片主要是英文原版,再次跨象乘云™ 发布《Python 知识卡片完整中文版》,覆盖:Bokeh,Jupyter Notebook,Keras,Matplotlib 绘图,Numpy 基础,Pandas 基础,Pandas 进阶,Python 基础,Scikit-Learn,SciPy,Seaborn,Spark RDD 基础,Spark SQL 基础,导入数据等核心技术领域。

《交互式线性代数》开放课程

线性代数是机器学习的基础性内容。而一般线性代数教程大多是照本宣科。最近佐治亚理工发布《交互式线性代数》教程开源书,提供了动态交互平台 —— 提供了 140 多个交互演示程序,可以让读者直观地理解代数背后的几何性质,使线性代数更加爱通俗易懂,帮你快速学习线性代数。

交互式演示:查看方程与曲线变化情况
交互式演示:查看方程与曲线变化情况

GitHub地址项目 GitHub 地址

神经网络结构可视化工具

对于我们算法分析人员来说,机器学习和神经网络早已不是什么新鲜内容,搭建、训练出来一个好的模型用于线上生产是必不可少的基础功能,对于业务人员或者是对于模型细节并不是很清楚或者是关注的人来说,这个就显得很抽象了,这个时候必要的可视化工作就显得很重要了,当前比较成熟的可视化工具大致包括:matplotlib、seaborn、Chaco 、pychart 、VPython 、yellowbrick等,这些是比较主流使用比较多的模块,但是对于模型结构的可是话来说显得就比较鸡肋了,这里迫切需要一些专业领域内的工具来帮助我们完成这些工作。

CNN
CNN
CNN
CNN

上面的这些图片都是可以一键生成的,顿时觉得功能很强大的。

GitHub地址项目 GitHub 地址

LaTeX 快速入门教程(附 PDF 下载)

一、书籍简介

LaTeX  是一个文档准备系统(Document Preparing System),它非常适用于生成高印刷质量的科技类和数学类文档。它也能够生成所有其他种类的文档,小到简单的信件,大到完整的书籍。LaTeX 使用 TeX 作为它的排版引擎。 这份短小的手册描述了 LaTeX2e 的使用,对 LaTeX 的大多数应用来说应该是足够了。参考文献对 LaTeX 系统提供了完整的描述。

二、主要内容目录

  • 第一章:讲述 LaTeX 的来源,源代码的基本结构,以及如何编译源代码生成文档。
  • 第二章:讲述在 LaTeX 中如何书写文字,包括中文。
  • 第三章:讲述文档排版的基本元素——标题、目录、列表、图片、表格等等。结合前一章的内容,你应当能够制作内容较为丰富的文档了。
  • 第四章:LaTeX 排版公式的能力是众人皆知的。本章的内容涉及了一些排版公式经常用到的命令、环境和符号。章节末尾提供了 LaTeX 常见的数学符号。
  • 第五章:介绍了如何修改文档的一些基本样式,包括字体、段落、页面尺寸、页眉页脚等。
  • 第六章:介绍了 LaTeX 的一些扩展功能:排版参考文献、排版索引、排版带有颜色和超链接的电子文档。
  • 第七章:介绍了如何在 LaTeX 里使用 TikZ 绘图。作为入门手册,这一部分点到为止。
  • 第八章:当你相当熟悉前面几章的内容,需要自己编写命令和宏包扩展 LaTeX 的功能时,本章介绍了一些基本的命令满足你的需求。

三、资源分享

同时为了方便大家,我们把最新 LaTeX 快速入门教程 (PDF)打包好了,可以直接下载。

LaTeX 代码数学神器

这是一个帮你快速把数学公式图片转成 LaTeX 代码的工具,名为 Snip,可以免费下载使用。操作非常简单!下载工具之后,只需要一个快捷键,把数学公式截图下来,它就能给你LaTeX代码,你也可以直接在任务栏中修改代码,然后复制、粘贴,写出自己的公式。而且,这一工具不仅仅适用于用电脑打出来的公式,你自己手写的公式,也可以识别出来。

Convert images to LaTeX
Convert images to LaTeX

更好的是,这个工具适用于 Mac、Windows、Ubuntu 系统,适用于所有支持 LaTeX 的编辑器。

 

德勤发布《中国教育发展报告2018》

进入教育新时代,新行业发展为产业带来多方机遇,加上中国经济的高速发展和国际化的不断加深,中国家庭对教育的需求和支出也逐步提高,更加注重将中外教育理念和教育方式有机结合,国际化教育市场热度持续上升,新技术应用也迅速渗透教育行业。根据德勤最新发布的调研报告《教育新时代:中国教育发展报告 2018 》显示,随着中国人口结构调整和国内市场的消费升级,教育消费占中国家庭消费支出的比重越来越大,中国教育市场也保持着良好的态势。此外,随着大数据、人工智能、立体化等技术的完善发展,教育行业长期存在的资源分配不均等问题将有望得到改善。与此同时,报告亦分析道,资本市场对民办教育持续看好,大量资本涌入,在商业环境变化、行业转型发展、以及市场竞争越趋激烈的背景下,企业在人才管理和运营管理各方面均面临更高的要求和挑战,如何将新技术更好地应用于教育行业从而实现高效赋能,也成为一个不可忽视的问题。

德勤预计,2018 年中国教育市场规模将达到人民币 2.68 万亿元,民办教育的总体规模将于 2020 年高达 3.36 亿元,并于 2025 年升至近 5 万亿元,实现 10.8% 的年均复合增长率。经历了四十几年的发展,国际学校在中国逐渐形成了独具特色的差异化道路,民办国际学校的数目将从 2017 年的 367 所增长到 2020 年的 600 所以上。从整体市场来说,国际学校未来仍有很大的增量空间,主要来自向二三线城市的不断渗透。随着教育与消费升级的需求,整体国际学校的市场规模将在 2020 年达到 436 亿元。留学需求旺盛、教育消费升级、升学竞争激烈和素质教育加强四位一体,促成国际学校需求持续旺盛。

再者,中国教育行业一直是资本市场的宠儿,数据显示,自 2014 年起,风投/私募基金对教育市场频频投资,投资总额和数量均不断攀升。截至 2018 年 6 月,已发起的教育行业投资案例共 137 起,投资总额达 25.7 亿美元,STEAM 教育、职业教育和早教市场分别占据了投资热点的前三位,占比分别为 30%、14% 和 12%。

德勤中国教育行业主管合伙人卢莹表示认为:『面对教育新时代,未来教育市场机遇与挑战并存。在国家政策和资本的支持与推动下,教育产业发展加速,中国教育市场正在孕育着新的趋势,国际教育、科技应用、人才管理和运营管理将成为教育行业新的发展机遇。加上资本和商业元素进入教育市场,教育机构应当在提升自身核心竞争力,重新梳理新时代下的运营管理挑战,适应数字化转型趋势,保证高质量教育的基础上,兼顾市场发展,积极开拓市场,深化精细管理。』

Python 知识卡片:Bokeh

继续之前的:

对于 Bokeh,应该与其他 Python 可视化库(如 Matplotlib 或 Seaborn)区别开来,因为它是一个交互式可视化库,非常适合希望快速轻松地创建交互式图表,仪表板和数据应用程序的任何人。Bokeh 也因在现代 Web 浏览器中实现大型数据集的高性能视觉呈现而闻名。

对于数据科学家来说,Bokeh 是快速轻松构建统计图表的理想工具。但也有其他优点,例如各种输出选项以及可将应用程序嵌入可视化的事实。我们不要忘记,各种各样的可视化定制选项使得这个 Python 库成为您数据科学工具箱不可或缺的工具。

现在,DataCamp 为那些已经参加课程并且仍然需要方便的单页参考或需要额外推动才能开始的人创建了知识卡片。简而言之,你会发现这张备忘单不仅向你展示了你可以制作美丽情节的五个步骤,还将向你介绍统计图表的基础知识。这款 Bokeh 备忘单很快就会让您熟悉如何准备数据,创建新图,使用自定义可视化为数据添加渲染器,输出图并保存或显示。而基本统计图表的创建将不再为您保留任何秘密。借助 Bokeh 提升您的Python数据可视化效果!Python 交互式数据可视化库 Bokeh 知识卡片 PDF 下载。

Python 知识卡片:数据导入

继续之前的:

在做任何数据清理,争论,可视化 … 之前,您需要知道如何将数据导入 Python。有很多方法可以将数据导入 Python,具体取决于您正在处理的文件。然而,你最经常使用 PandasNumPy 库:熊猫库是数据科学家进行数据操作和分析的首选工具之一,旁边是用于数据可视化的 matplotlib 和 NumPy,它是基础库 Python 中的科学计算 Pandas 的建立。在 Python 导入表中导入数据时,您会发现一些 NumPy 和 Pandas 函数以及 Python 编程语言中构建的函数,这些函数将帮助您快速获取 Python 中的数据!Python 数据导入知识卡片 PDF 下载。

Python 知识卡片:Scikit-Learn

继续之前的:

大多数使用 Python 学习数据科学的科研工作人员与学生,肯定会听说 scikit-learn,这是一个开源的Python 库,它通过统一的界面实现了各种机器学习,预处理,交叉验证和可视化算法。如果你对这个领域还很陌生,你应该意识到机器学习以及 Python 库是属于每个有抱负的数据科学家必须知道的。

此前,跨象乘云™ 曾经介绍了完整的 scikit-learn 算法工程导图,这次 DataCamp 为您已经开始学习 Python 包的人创建了 scikit-learn 知识卡片,但仍需要一个方便的参考表。或者,如果您仍然不了解 scikit-learn 的 工作原理,这本机器学习知识卡片可能会派上用场,以便快速了解您需要知道的基本入门知识。无论哪种方式,当您解决机器学习问题时,我们确信您会发现它很有用!这个 scikit-learn 知识卡片将向您介绍您需要经过的基本步骤,以成功实现机器学习算法:您将看到如何加载数据,如何对其进行预处理,如何创建自己的模型您可以调整数据并预测目标标签,如何验证模型以及如何进一步调整以提高其性能。Python scikit-learn 库知识卡片 PDF 下载。