近期,Tianchi 发布了一份非常全面的开源数据集。包含了计算机视觉,自然语言处理,智能金融,智能商务,智能医疗,智能制造,智能农业,智能教育等数据集,非常适合学习和实践。
月度归档: 2021年1月
工业级 AI 项目落地的挑战
很多人在科研项目中以为机器学习、人工智能就仅仅是模型训练,带有一台性能比较好、带 GPU / TPU 的机器进行模型训练就可以了。如果这么认为,那么只能说明该观点尚处于预研阶段或实验室阶段。在真实的生产环境中,模型训练只是机器学习流程中很小的一个模块,而大部分工作是模型训练之外的工作,如:平台的搭建和配置、数据收集、数据检查、数据转换、模型分析、监控、日志收集和分析、服务发布和更新、迁移训练等。从另外一个方面说,只有当你的科研项目足够充分的考虑到模型在现实环境中的各方面部署需求时,你科研结果 —— 也就是训练出来的模型才具有实际价值,科研成果才有被转换的真正意义上的可行性。
工业 AI,[……]
《大数据白皮书(2020年)》
2020 年 12 月 18 日,由中国信息通信研究院(以下简称“中国信通院”)、中国通信标准化协会大数据技术标准推进委员会主办的:2020 数据资产管理大会,在京召开。会上,中国信通院发布《大数据白皮书(2020年)》。这是中国信通院第五次发布大数据白皮书。白皮书在此前四版的基础上,回顾了去年以来大数据各领域的最新进展,并对“十四五”期间大数据的发展趋势进行了展望。
相关链接:《大数据白皮书(2019年)》[……]