在过去几年里,处理语言的机器学习模型的进展一直在迅速加快,同时,领域智能服务聊天机器人逐渐成为新一代人工智能研究的重要领域。自然语言处理技术(NLP)的进步,已经离开了研究实验室,开始为一些领先的数字产品提供动力。自 2016 年起,聊天机器人便成为最热门的技术发展趋势之一。最大的消息平台,如:Facebook Messenger,宣布启动开发人员计划来支持聊天机器人应用。与此同时,较小的消息平台,如:Slack 和 Telegram,启动了『机器人商店』和投资基金来吸引开发人员。Google 则直接投资于受其人工智能和大数据技术支持的聊天机器人应用程序上,如:Meena。自然语言处理技术在人工智能服务的进步,是聊天机器人的一个关键促进因素。人工智能使现代聊天机器人能跳出“电话树”的陷阱,变成人类用户的伙伴。与自然语言相关的重要服务包括 ——
- 基于规则的模式识别:此类型的示例包括日期、电子邮件、电话号码、数量和触发文字。这些规则通常在应用程序中实现为正则表达式。这些规则的优势是,它们很精确,而且您可以添加和抽象化规则来确定无疑地处理新情形和解决错误。
- 自然语言分类器:此人工智能服务类型用于检测和分类用户命令的意图。例如,当用户询问 “今天热吗”,人工智能应知道用户询问的是今天的温度。这个分类器的构造方式是,使用一个应用领域的许多实际的语音表达来训练算法。
- 基于规则的对话管理器:基于用户的意图和与该意图相关的数据,比如位置和时间,该服务可应用规则和生成脚本化响应。
- 语音识别:尽管如今许多高端智能电话的文本输入方法中都内置了语音识别功能,但第三方语音识别功能仍然非常重要。此外,在某些情况下,存储用户的语音能够供以后分析这一点很重要(比如在客户服务中,当主管想检查用户的情绪和语气时)。
作为开发人员,现在是赶上『下一代热门技术』的重要发展浪潮的最佳时机。譬如:苹果的 Siri,微软的小冰,百度地图智能导航,都极具战略意义。除了智能客服,聊天机器人还可以应用于导购、门诊咨询、招聘、政务咨询、交易查询、投资分析等各种场合。学生通过真实的项目案例实训,能有效的掌握如何通过部署轻量型的聊天机器人框架,开发智能客服系统(或 App),并为客服系统添加诸如:基于规则的模式识别,自然语言分类器,基于规则的对话管理器等人工智能模块。
项目目标
智能机器人可以做到的事情可以很复杂:文字、语音、视频识别与合成;自然语言理解、人机对话;以及驱动硬件设备形成的『机器』人。本项目专注于自然语言和人工智能相关的内容,不涉及硬件及多媒体识别和合成,其目标为实现一个可以和用户对话,帮助用户解决问题的聊天机器人。本工程案例项目,将通过多次项目迭代,从基础的基于 NLTK 文本处理技术起步,逐步向 CNN / RNN / LSTM,深度学习,语料库建设,Word2vec,seq2seq,TensorFlow 开发,中文语言技术平台应用,聊天机器人项目开发要点及性能优化等高级主题升级。完成工程案例后,学生可并通过引入更多的聊天机器人开发框架,实现面向专用领域,如:天气预报等方向的聊天机器人。
关键技术
NLTK,CNN / RNN / LSTM 神经网络,Word2vec,seq2seq,语言分析和理解、语言生成、机器学习、人机对话、信息检索、信息传输与信息存储、文本分类、自动文摘、数学方法、语言资源、语料库建设,系统评测。