工业级 AI 项目落地的挑战

很多人在科研项目中以为机器学习、人工智能就仅仅是模型训练,带有一台性能比较好、带 GPU / TPU 的机器进行模型训练就可以了。如果这么认为,那么只能说明该观点尚处于预研阶段或实验室阶段。在真实的生产环境中,模型训练只是机器学习流程中很小的一个模块,而大部分工作是模型训练之外的工作,如:平台的搭建和配置、数据收集、数据检查、数据转换、模型分析、监控、日志收集和分析、服务发布和更新、迁移训练等。从另外一个方面说,只有当你的科研项目足够充分的考虑到模型在现实环境中的各方面部署需求时,你科研结果 —— 也就是训练出来的模型才具有实际价值,科研成果才有被转换的真正意义上的可行性。

工业 AI,[……]

继续阅读

《大数据白皮书(2020年)》

2020 年 12 月 18 日,由中国信息通信研究院(以下简称“中国信通院”)、中国通信标准化协会大数据技术标准推进委员会主办的:2020 数据资产管理大会,在京召开。会上,中国信通院发布《大数据白皮书(2020年)》。这是中国信通院第五次发布大数据白皮书。白皮书在此前四版的基础上,回顾了去年以来大数据各领域的最新进展,并对“十四五”期间大数据的发展趋势进行了展望。

相关链接:《大数据白皮书(2019年)》[……]

继续阅读

2020 年中国信通院白皮书合集

本合集包括 2020 年度中国信通院发布的 28 本白皮书,打包下载链接

  •   “互联网+行业” 个人信息保护研究报告
  •   工业互联网产业经济发展报告
  •   基于用户体验的移动网络质量白皮书
  •   数字中国产业发展报告(2020年)——信息通信产业篇
  •   中国数字经济发展白皮书(2020)
  •   云计算发展白皮书
  •   中国互联网行业发展态势暨景气指数报告(2020)
  •   中国网络安全产业白皮书
  •   人工智能治理白皮书
  •   中国金融科技生态白皮书(2020年)
  •   全球数字经济新图景(2020年)
  •   中国宽带发展白皮书
  • [……]

    继续阅读

眼底 OCTA 血管分割数据集(ROSE)及新型的血管分割框架

对眼底 OCTA 图像中的血管结构进行提取分割,除了有助于临床医生对许多眼科疾病的诊断外,还有望为观测和评估包括阿尔茨海默氏病(AD)等在内的神经退行性疾病发展开辟新途径。目前基于视网膜 OCTA 图像的自动血管分割研究相对较少,一方面由于 OCTA 图像存在低信噪比、投影伪影等问题,另一方面也缺少公开的 OCTA 血管分割数据集用于训练分割模型,因此 OCTA 图像中血管结构的自动分割仍存在很大的挑战。今天向大家介绍一篇近期发表在 IEEE-TMI 的一篇研究论文,该论文公开了领域内一个为数不多的眼底 OCTA 血管分割数据集(ROSE),并以此为基础提出了用于眼底 OCTA 血管分割的新型[……]

继续阅读

英特尔 AI 制造实战手册

在质量监控、产量提升、故障监控、维保预测、能源管理、机械臂控制以及市场分析预估等使用场景中,越来越多的 AI 软硬件产品及解决方案正发挥越来越大的作用,市场前景广阔。英特尔与众多合作伙伴一起,充分评估一线生产场景的实际状况,一方面为不同场景选择合理的算法,满足检测系统在速度和精度上的需要;另一方面,也推动边缘计算等创新基础设施架构在 AI 应用中的运用,并取得了良好的成效。[……]

继续阅读

《2020人工智能医疗产业发展蓝皮书》

近年来,人工智能成为推动社会经济发展的新动力之一,在提高社会生产效率、实现社会发展和经济转型等方面发挥重要作用。

作为主导新一代产业变革的核心力量,人工智能在医疗方面展示出了新的应用方式,在深度融合中又催生出新业态。AI 医学影像是人工智能在医疗领域应用最为广泛的场景,率先落地、率先应用、率先实现商业化。手术机器人、药物研发、精准医疗等领域已有部分落地应用,但因成本或技术原因,尚未实现规模化普及,未来增长空间较大。

受新冠肺炎疫情影响,人工智能在公共卫生领域特别是传染病的预防与控制方面发挥重要作用,传染病大数据分析预警系统、疫情排查系统、智能测温机器人、消毒机器人、语音服务机器人等[……]

继续阅读

大数据如何变革医疗保健行业

医疗保健行业在不断创造奇迹。无论是让盲人重见光明,帮助瘫痪的人恢复行动能力,还是进行基因重组以避免疾病,如今的医生正以新的方式拯救生命,改善人们的生活。这些戴着听诊器、穿着实验服的天才为整个社会带来福祉。

尽管已取得较大进步,医疗保健行业仍在努力试图解答一些颇为迫切的问题。如何帮助更多人活得更长寿、更健康?如何遏制飞涨的医疗保健费用?在数据泄露经常发生的时代,如何保护大量的个人信息和病历?

斯坦福大学的研究人员指出,答案在于对这个行业产生的大量数据进行处理,然后利用这些数据解决问题。 斯坦福大学的研究人员分析了大数据的需求、潜能和能力,并在题为《在医疗行业利用数据的力量》 (Har[……]

继续阅读

可信任深度学习代码之单元测试

深度学习是一门很难评估代码正确性的学科。随机初始化、庞大的数据集和权重的有限可解释性意味着,要找到模型为什么不能训练的确切问题,大多数时候都需要反复试验。在传统的软件开发中,自动化单元测试是确定代码是否完成预期任务的面包和黄油。它帮助开发人员信任他们的代码,并在引入更改时更加自信。一个破坏性的更改将会被单元测试检测到。

从 GitHub 上许多研究库的情况来看,深度学习的实践者们还不喜欢这种方法。从业者不知道他们的代码是否正常工作,他们能接受吗?通常,由于上述三个原因,学习系统的每个组件的预期行为并不容易定义。然而,我相信实践者和研究人员应该重新考虑他们对单元测试的厌恶,因为它可以帮助研[……]

继续阅读