跨象乘云™ 开发了多个真实的商业级项目实训案例,通过完整的『端到端』业务流程演示与上机操作训练,让学生真正了解人工智能行业背景以及企业实施技术需求,通过直观而具备针对性的训练使学生在最短时间内得到应用技术技能的提升,更进一步满足职业岗位对工作技能的需求。从而使学生能够学习到:
- 从宏观上理解深度学习与新一代人工智能的整体业务流程,项目开发资源组织方式,以及系统组件部署模式;包括:Docker 容器技术,神经网络可编程服务接口,TensorFlow 等深度学习框架在内的人工智能核心技术,实现技术整合与解决方案设计;
- 人工智能项目开发的全生命周期,并且通过定义一组共同的目标、数据源、技术、团队和战略规划来启动人工智能开发项目;
- 如何在人工智能项目前期完成收集、分析、预处理和标注数据任务。同时对比各种深度学习框架,选择满足需要的最佳框架,完成软硬件选型;
- 设置包括数据,算法模型,计算资源在内的实验性基础设施,挑选合适的深度学习模型,完成模型训练,并且通过反复测试验证操作获得理想的结果;
- 完成将模型从测试平台到上限部署,将应用从原型发展到可运行的 WEB 应用程序;
完成项目实训后,学生将能深刻认知深度学习与新一代人工智能的应用场景以及价值,并通过参与商业级人工智能项目开发,了解相关项目的开发流程以及项目管理重点。项目案例提供完整的源代码及运行环境配置模板,使学生不但能在实训环节中重现该应用程序项目,更可以通过举一反三的方式,从实例(如:鸢尾花的数据集)中提取抽象理论(基于特征集的分类算法模型);再返回应用至更多的实例(如:通过定义新的特征集对购物者进行分类,从而挖掘潜在高净值消费者)中,从而创造出更多的人工智能应用。
项目界面

项目背景
5G 移动网络架构日益多样化且复杂性不断提高,监控和管理众多网络元素的问题因而变得棘手。因此,广大研究人员对多功能机器智能嵌入未来移动网络这一课题的兴趣空前高涨。这种趋势反映在机器学习(ML)解决方案中,从无线接入技术(RAT)选择,到恶意软件检测,以及支持机器学习实践的网络系统的开发。机器学习能够从流量数据中系统地挖掘有价值的信息,并自动发现其相关性,这类问题对于人类专家来说太过复杂。作为机器学习的重要部分,深度学习在计算机视觉和自然语言处理(NLP)等领域取得了卓越的进展。网络研究人员也开始认识到深度学习的重要性,并探索如何将深度学习应用到移动网络领域。
我们有充分理由在在 5G 移动和无线网络中嵌入深度学习,尤其在处理移动环境产生的异构数据。因为这些数据通常来源广泛,格式各异,并且表现出复杂的相关性。传统的机器学习工具需要繁琐的特征工程才能根据这些数据做出准确的推论和决策。深度学习消除了领域专业知识的门槛,因为它采用分层特征提取,该技术可以有效地提取信息并从数据中获取越来越抽象的相关性,同时最大限度地减少数据预处理工作量。基于图形处理单元(GPU)的并行计算进一步使深度学习能够在毫秒内,进行推理。这有利于分析网络,提高管理准确度并克服传统数学技术(例如凸优化、博弈论、元启发式)的运行时间限制。
深度学习在移动网络领域应用广泛。无线传感器网络(WSN)由一组分布在不同地理区域的独特或异构传感器组成。它们通过无线通道协同监测物理或环境状态(如温度、压力、运动和污染),并将已收集数据传输到中心服务器。基于云的方法在云端推断并将结果发送给边缘设备。相反,基于边缘的方法则是在边缘设备上部署可进行本地推理的模型。
无线网络其实还能使用强化学习和模仿学习等先进的技术控制移动网络,下图示意为应用于移动和无线网络管控的三种管控方法,以及原理,即强化学习(上)、模仿学习(中)和分析管控(下)。可见,深度学习在移动和无线网络领域扮演着日益重要的角色。

项目目标
本项目的目标,是在电信中使用信号和信道来执行机器学习(ML)。由于当前 5G 尚未大规模商用化,我们需要根据传输通信架构,利用模拟器产生一系列 5G 模拟数据。本项目工程采用的分阶段实施如下 ——
- 第一阶段:采用 Python 代码复用(自动化编排脚本)来调用流量模拟器和光线跟踪模拟器来获取原始数据,例如:MIMO 信道表示层。 第一阶段就是业务流量模拟器和光线追踪模拟器的模拟构成
- 第二阶段,原始数据被组织成一个 5G MIMO 数据库,根据目标应用程序,可以是信道估计,光束训练等。
- 第三阶段:后处理阶段,是将 5G MIMO 数据转换为适合机器学习的格式。
- 第四阶段:是使用例如与 KERAS 的深度学习来运行机器学习实验。
我们提供了执行所有 4 个阶段的代码,以及一些生成的数据集,以促进可重复的研究。学生可以在完整的5G 通信仿真架构中,了解相关数据的产生来源及业务流程。并根据我们提供的基于深度学习分类与回归的三个智能化运营实验,实现对 5G MIMO 波束的智能选择与管理。
最后,学生也可以直接地使用数据集,跳过除第四阶段的所有阶段,使用自己的机器学习代码进行分析。相关提供的数据同时兼容 5GMdata 格式(第2阶段的输出),与 Python 的格式(.npz 文件中的 numPy 数组)和 Matlab( hdf5 文件),作为第 3 阶段的输出。