人工智能技术服务(610217)学习路径及人才培养模型

人工智能技术服务专业(专业代码:610217),是 2019 年增补专业,主要面向人工智能产业及其应用相关的企事业单位,在人工智能技术应用开发、系统运维、产品营销、技术支持等岗位群,咶从事人工智能应用产品开发与测试、数据处理、系统运维、产品营销、技术支持等工作。

人工智能技术服务(610217)学习路径及人才培养模型
人工智能技术服务(610217)学习路径及人才培养模型

专业课程目录包括 ——

  1. 人工智能导论
  2. 数据预处理与数据标记
  3. 大数据基础与实战
  4. 智能数据挖掘
  5. 机器学习
  6. TensorFlow 2.0 框架
  7. 多框架人工智能开发
  8. 计算机视觉与项目实战
  9. 自然语言处理
  10. 边缘计算嵌入式开发(自动驾驶)
  11. 人脸识别
  12. 智能化软件工程
  13. 前端智能 WEB 应用开发

《人工智能导论》课程

本课程面向初次接触人工智能的学生,涵盖的主题包括:人工智能的历史,人工智能在企业及各行各业的应用,解释为何数据对训练神经网络至关重要,以及数据科学工作流程的步骤,同时向学生介绍监督学习和深度学习,并介绍当前的硬件和软件选型。同时,神经网络原理可视化解析器,是一个面向深度学习与新一代人工智能,以图形化界面用于教学目的的简单神经网络交互式演示项目,它非常强大地可视化了神经网络的训练过程。通过直观的交互式演示与实验,让教研人员与学习者高效的掌握神经网络背后的核心思想,并在短时间内对神经网络工作原理以及核心概念具备深刻的认知。通过神经网络可视化解析器,来了解神经网络的原理,通过对源数据,进行训练以达到对数据进行分类的目的(分为正、 负两类)。让学生深刻了解到:什么是神经网络、数据选取、特征选取、隐藏层可视化、输出结果、参数调整、 激活函数等全方面来展示进行网络神经需要哪些操作。

神经网络原理可视化解析器 -《人工智能导论》课程教学演示平台
神经网络原理可视化解析器 -《人工智能导论》课程教学演示平台

《数据预处理与数据标记》课程

机器学习和深度学习项目在大多数企业中变得越来越重要。同时,一个完整的项目流程包括数据整理(Data Preparation)、构建分析模型以及部署至生产环境。该流程是一个:洞察与行动的循环,此循环能不断地改进分析模型。当你打算使用机器学习或深度学习技术来构建分析模型时,一个重要的任务是集成并通过各种数据源来准备数据集,这些数据源包括比如文件、数据库、大数据存储、传感器或社交网络等等。此步骤可占整个分析项目的 80%。显然,数据整理是数据科学的核心。它包括数据清洗和特征工程。另外领域知识(Domain Knowledge)也非常重要,它有助于获得好的结果。数据整理不能完全自动化,至少在初始阶段不能。通常,数据整理会占去整个分析管道(流程)的 60% 到 80%。但是,为了使机器学习算法在数据集上获得最优的精确性,数据整理必不可少。《纽约时报》指出,数据清洗与数据整理等预设工作,是大数据科学家获得科研及业务成果的关键。本课程重点让学生掌握强大的数据预处理和数据整理工具,而且不局限与计算机专业学生使用,实现对大数据预处理与数据整理标准化流程的认知,掌握,以及扩展。让学生全面并深入了解对凌乱数据进行数据预处理,数据整理,数据清洗,数据归类透视,数据库关联查询,以及基于 Web 服务实现数据扩展处理等各项关键技术。

另一方面,训练深度神经网络需要数据。很多数据。并且根据手头的 AI 架构,如果没有标记,那么这些数据就没有多大用处,这需要时间 – 特别是当你正在处理包含数十万个对象的语料库时。为了减轻数据注释和数据科学家的负担,人工智能行业提供了多种计算机视觉注释工具,旨在加快用于训练计算机视觉算法的视频和图像样本的注释。本课程借助当前流行的深度学习数据标记工具,通过大量的可视化实践训练,使学生掌握与对象检测、图像分类和图像分割相关的监督机器学习任务,以及四种类型的数据注释技巧:框、多边形、折线和点等,获取高效的数据标记能力。

数据预处理与清洗平台 -《数据预处理与数据标记》课程支撑平台
数据预处理与清洗平台 -《数据预处理与数据标记》课程支撑平台

《大数据基础与实战》课程

无论是人工智能,机器学习还是深度学习,其发展与壮大均得益于大数据产业的不断成熟。只有在海量数据,多来源数据,多格式数据分析框架的支撑下,机器学习与深度学习的各种算法模型,才能经过不断的训练,重复验证循环,最终得到理想的结果,而形成机器智能认知。大数据已成为人工智能的基础设施,如何实现大数据与人工智能的有机结合,已成为现今高科技互联网企业的重点探索方向。

2018 年,跨象乘云™ 与华中科技大学软件学院合作,面向数据科学与大数据技术专业,编写《数据科学与大数据技术专业系列规划教材》,经专家评审,确定列入人民邮电出版社教育出版的重点规划。同时,跨象乘云™ 配套企业级仿真工程实践系统环境,专业教育资源,贯穿教学综合案例,科研与教学数据集。为高等院校开设数据科学与大数据技术专业,大数据技术与应用专业,深度学习与新一代人工智能科研及相关学科建设,部署校内新一代人工智能开放创新平台提供强有力的支撑。

跨象乘云大数据工程系统实践环境架构
跨象乘云大数据工程系统实践环境架构

《大数据基础与实战》课程,基于合作教材开发,是真正面向企业大数据业务的实践性课程,旨在帮助学生了解:各种大数据技术如何运作,这些技术应何时用于较大规模的大数据项目中,它们如何同时发挥作用,为企业提供最高的投资回报率。该课程旨在阐述大数据项目的五个阶段战略,使客户如何使用并充分利用大数据。这五个阶段包括:

  • 数据处理底层架构(阶段 1)
  • 数据采集和存储(阶段 2)
  • 数据访问和处理(阶段 3)
  • 数据统一和分析(阶段 4)
  • 数据安全/可视化/性能优化(阶段 5)

每个阶段均包括 Hadoop 核心组件和生态系统技术以及大数据技术或产品。学生将学习信息管理系统如何采用一种全面的方法将大数据(非结构化和半结构化)与关系数据(结构化)进行整合,从而发现更多嵌入大数据池中的价值。同时,通过:电子商务金融健康医疗等真实的商业级项目实训案例,完整的『端到端』业务流程演示与上机操作训练,让学生真正了解大数据行业背景以及企业实施技术需求,通过直观而具备针对性的训练使学生在最短时间内得到应用技术技能的提升,更进一步满足职业岗位对工作技能的需求。从而使学生能够学习到:

  • 大数据整体业务流程及系统组件部署模式;
  • 数据源捕获与多格式数据集成,实现『全』数据分析与挖掘;
  • 应用多种分析算法获得最佳预测计算模型;
  • 利用数据可视化分析系统展现最佳商业智能视图;
  • 通过参与商业项目研发流程,有效掌握岗位所需技能,实现精确匹配;
工程项目案例:构建用户行为分析推荐系统架构
工程项目案例:构建用户行为分析推荐系统架构

《智能数据挖掘》课程

在数据科学技术迅猛发展的今天,各行业都意识到大数据人才,算法工程师的重要性。同时,许多目前大部分机器学习,人工智能平台均需要一定的编程基础。造成许多非计算机专业的经管类,统计及数理类学生,无法施展其在算法上的竞争力,书本上学到的数据科学知识也无法在实验环境中验证。本课程配套可视编程机器学习平台,通过直观的交互式可视化编程界面,让没有编程能力的学生,同样能完成非结构化数据处理,数据挖掘,机器学习,模型分析,算法优化等操作。同时为高等院校深化数据科学与大数据技术理论教学,并培养实际动手能力的应用型人才,提供强力的支撑。

课程概要:了解并强化数据挖掘的基本概念,学习如何使用数据进行分析,实现预测分析功能。数据挖掘是图形化扩展工具,用于直接对数据进行业务分析。建立多种数据挖掘模型,通过将成熟的模型应用到新数据中,实现业务预测与分析洞察。课程通过描述基本的数据挖掘概念,使学生能准确描述预测分析的优势。理解数据挖掘的主要任务,描述数据挖掘业务流内的关键步骤。使用数据挖掘建立,改进,应用多种数据模型。通过项目实际训练,实现对各种业务需求类型的分析与洞察,包括:预测个体行为,价值预测,关联时间搜索。

可视编程机器学习平台 -《智能数据挖掘》课程支撑平台
可视编程机器学习平台 -《智能数据挖掘》课程支撑平台

《机器学习》课程

在如今这个处处以数据驱动的世界中,机器学习,深度学习,人工智能正变得越来越大众化。在大数据的爆发性增长背景下,当今的机器学习技术已经被广泛地应用于不同领域,如搜索引擎、机器人、无人驾驶汽车等。机器通过分析大量数据来进行学习。比如说,不需要通过编程来识别猫或人脸,它们可以通过使用图片来进行训练,从而归纳和识别特定的目标。机器学习是一种重在寻找数据中的模式并使用这些模式来做出预测的研究和算法的门类。机器学习是人工智能领域的一部分,并且和知识发现与数据挖掘有所交集。

《机器学习》课程 - 为学生高效构建机器学习算法模型思维地图。贯穿算法原理、代码实现、行业应用工程闭环。
《机器学习》课程 – 为学生高效构建机器学习算法模型思维地图。贯穿算法原理、代码实现、行业应用工程闭环。

本课程,覆盖机器学习核心算法模型,为学生打下坚实的机器学习算法模型基础,通过超过 20 个实战项目,使学生从技术原理,到算法模型,到行业应用贯穿始终。不但了解机器学习本身在分类,回归预测等方面的部署,更能充分了解每种算法的应用场景。同时,课程还将介绍与深度学习密切相关的关键概念,如:拟合不足和拟合过度、正则化及交叉验证,如何辨别要解决的问题的类型,选择正确的算法,调优参数以及模型验证等主题。基于极易上手入门的流行编程语言 Python,首先通过实用的案例介绍机器学习的基础知识,然后介绍一些稍微复杂的机器学习算法,例如:支持向量机、极端随机森林、隐马尔可夫模型、条件随机场、深度神经网络 …… 等。通过大量的实战案例,了解如何使用当前最火的 Python 编程语言,结合机器学习算法解决各类实际的业务问题。譬如:使用探索分类分析算法实现收入等级评估;使用无监督学习实现市场细分;使用隐马尔科夫模型实现语音识别 …… 等,并深刻掌握以下机器学习核心库的原理与应用:

《TensorFlow 2.0 框架》课程

TensorFlow 是由 Google 开发并开源发布的一种流行的机器学习框架及用于数据流编程的框架库。《TensorFlow 深度学习框架 (KXCY-AI-LAB-TF)》课程,通过深度学习交互平台、动画演示教育资源,以及交互式编程实验环境,让学生充分理解如何利用 TensorFlow 构建神经网络模型,神经网络网络构造、内核、池化 (Pooling) 和多级分类等核心概念,线性回归、损失函数和梯度下降等关键技术,用于卷积神经网络 (CNN) 的基本模板,以及可调整的不同参数。并且理解如何利用使用迁移学习(Transfer Learning)充分利用现有网络,即在现有网络之上建立新网络。课程内嵌经典图像分类项目:『猫/狗』识别。从而使学生通过手动实践,了解卷积神经网络的建立,识别过拟合,以及卷积神经网络特征提取与调优等关键技术。

同时,本课程配套基于 TensorFlow 2.0 的实验操作课程,通过大量的实验使学生快速掌握 TensorFlow 2.0 的各项先进特性。包括:用 Keras 建立简单的模型并执行;在任何平台上的生产中进行强大的模型部署;强大的研究实验;通过清除不推荐使用的 API 和减少重复来简化 API 等。

《多框架人工智能开发》课程

当前,深度学习与新一代人工智能框架已进入百花齐放的时期,自 PyTorch 推出以来,其热度持续上升,一度有赶超 TensorFlow 的趋势。PyTorch 能在短时间内被众多研究人员和工程师接受并推崇是因为有着诸多优点,如采用 Python 语言、动态图机制、网络构建灵活以及拥有强大的社群等。因此,走上学习 PyTorch 的道路已刻不容缓。另一方面,MXNet 以其超强的分布式支持,明显的内存、显存优化为人所称道。同样的模型,MXNet 往往占用更小的内存和显存,并且在分布式环境下,MXNet 展现出了明显优于其他框架的扩展性能。2016 年 11 月,MXNet 被 AWS 正式选择为其“云计算”的官方深度学习平台。

本课程以深度学习作为核心理论框架,同时对每一个用例配套包括:Tensorflow 2.0 + Keras / Pytorch / MXNet 的实现方式,使学生深刻掌握多种人工智能开发框架的核心技术与实现方式,通过工程实践切实理解各种框架的区别及各自优越性能,建立更为完善的人工智能知识架构体系。

多框架人工智能开发
多框架人工智能开发

《计算机视觉与项目实战》课程

本课程旨在帮助大家快速掌握机器视觉领域必备知识点原理及其在 OpenCV 中的使用方法。同时,学生将了解如何在产业中使用计算机视觉,学习图像处理的主要算法,探讨机器学习如何用于计算机视觉,完成课程后,学生将掌握图像处理、转换和分类的不同技术,了解如何将深度学习应用于视觉任务,以及完成重要的计算机视觉方法,如图像分段和边缘提取。本课程整体设计以项目实战来驱动学习,课程中所有代码均使用 Python 完成,在实战中首先讲解整体解决方案,接下来通过 Debug 模式来一步步分析每一行代码的作用及其完成的效果,提供全部课件及项目中所使用代码和数据。项目案例包括:信用卡数字识别、文档扫描 OCR 识别、全景图像拼接、停车场车位识别、答题卡识别判卷、目标追踪、疲劳检测等多个精彩实用案例。

《计算机视觉与项目实战》课程
《计算机视觉与项目实战》课程

《自然语言处理》课程

本课程将介绍在现代架构上实现自然语言处理技术,主题包括:如何操控用于语言模型的文本,文本生成和主题建模,通过更高级概念的机器学习基础。本课程结束时,学生将掌握以下方面的实践知识:字符串预处理技术的应用,如何将机器学习算法应用于文本分类和其他语言任务。同时,配套BERT模型语句情感分类实战项目案例,基于业内最先进的自然语言处理模型:BERT。基于 IMDB 电影评论的点评文本,实现语句分类与情感分析,覆盖自然语言处理操作的必要步骤与高级特性,包括 —— BERT 模型架构,NLP 迁移学习,句型情感分类,NLP 模型训练,Word2vec,distilBERT 模型,scikit-learn 机器学习库等,并提供图文生动的技术讲解与代码演示。每个技术点均提供独立的执行脚本,源代码,测试用数据以及分解实验指导,让学生充分了解 NLP 技术相关的关键概念与先进的 BERT 模型的技术实现,以及复杂的自然语言处理流程。