BERT 语句情感分类

跨象乘云™ 开发了多个真实的商业级项目实训案例,通过完整的『端到端』业务流程演示与上机操作训练,让学生真正了解人工智能行业背景以及企业实施技术需求,通过直观而具备针对性的训练使学生在最短时间内得到应用技术技能的提升,更进一步满足职业岗位对工作技能的需求。从而使学生能够学习到:

    1. 从宏观上理解深度学习与新一代人工智能的整体业务流程,项目开发资源组织方式,以及系统组件部署模式;包括:Docker 容器技术,神经网络可编程服务接口,TensorFlow 等深度学习框架在内的人工智能核心技术,实现技术整合与解决方案设计;
    2. 人工智能项目开发的全生命周期,并且通过定义一组共同的目标、数据源、技术、团队和战略规划来启动人工智能开发项目;
    3. 如何在人工智能项目前期完成收集、分析、预处理和标注数据任务。同时对比各种深度学习框架,选择满足需要的最佳框架,完成软硬件选型;
    4. 设置包括数据,算法模型,计算资源在内的实验性基础设施,挑选合适的深度学习模型,完成模型训练,并且通过反复测试验证操作获得理想的结果;
    5. 完成将模型从测试平台到上限部署,将应用从原型发展到可运行的 WEB 应用程序;

完成项目实训后,学生将能深刻认知深度学习与新一代人工智能的应用场景以及价值,并通过参与商业级人工智能项目开发,了解相关项目的开发流程以及项目管理重点。项目案例提供完整的源代码及运行环境配置模板,使学生不但能在实训环节中重现该应用程序项目,更可以通过举一反三的方式,从实例(如:鸢尾花的数据集)中提取抽象理论(基于特征集的分类算法模型);再返回应用至更多的实例(如:通过定义新的特征集对购物者进行分类,从而挖掘潜在高净值消费者)中,从而创造出更多的人工智能应用。

项目概要

在过去几年里,处理语言的机器学习模型的进展一直在迅速加快。这一进步已经离开了研究实验室,开始为一些领先的数字产品提供动力。这方面的一个很好的例子是最近关于 BERT 模型如何成为谷歌搜索背后的主要力量的公告。谷歌认为,这一步(或在搜索中应用自然语言理解的进步)代表了:『过去五年最大的飞跃,也是搜索历史上最大的飞跃之一』。

 IMDB 电影评论的点评文本
IMDB 电影评论的点评文本

本案例基于业内最先进的自然语言处理模型:BERT。基于 IMDB 电影评论的点评文本,实现语句分类与情感分析,覆盖自然语言处理操作的必要步骤与高级特性,包括 —— BERT 模型架构,NLP 迁移学习,句型情感分类,NLP 模型训练,Word2vec,distilBERT  模型,scikit-learn 机器学习库等,并提供图文生动的技术讲解与代码演示。每个技术点均提供独立的执行脚本,源代码,测试用数据以及分解实验指导,让学生充分了解 NLP 技术相关的关键概念与先进的 BERT 模型的技术实现,以及复杂的自然语言处理流程。