非官方 GPT-3 开源

Eleuther AI 推出的名为 GPT-Neo 的开源项目,开源了复现版 GPT-3 的模型参数( 1.3B 和 2.7B 级别),并将其更新在 Colab notebook 之上。需要指出的是这次开源的模型里较大的那个版本也只是到了 GPT-3 商用版里最小模型的参数量,不过 Eleuther AI 表示未来会进一步开源 10B 版本和原始大小版本的 GPT3 模型参数。

但关于复现模型的性能,目前只说『实验表现与原版 GPT-3 相当』。风靡一时的拥有 1,750 亿超大参数量,一出道便被视作 NLP 领域最强 AI 模型的 GPT-3,得益于其庞大的参数量,使得 GPT-3 拥[……]

继续阅读

全球最大的人眼图像开源数据集 – TEyeD

涵盖 2D 和 3D 特征点、语义分割、3D 眼球注释以及注视向量和眼动类型等因素,德国图宾根大学的研究者发布论文,创建了全球最大的人眼图像公开数据集 —— TEyeD

在当今世界,基于图像的眼动追踪(eye tracking)变得越来越重要,这是因为人眼运动有可能变革我们与周围计算机系统交互的方式。此外,眼动的方式可以识别甚至在某种程度上预测我们的行动和意图,所以眼动分析可以赋能新的应用,特别是与 VR 或 AR 等现代显示技术结合时。例如,人眼注视(gaze)信号连同人机交互的可能性,使得残疾人能够借助专门为其疾症设计的特殊设备来与环境进行交互。在手术显微镜的应用场景中,外科医生必[……]

继续阅读

清华大学发布《智慧人才发展报告》

人才是国家科技创新经济发展的首要驱动力,是在当今日趋严峻的国际竞争中取得优势的核心要素。习近平总书记在座谈会上指出 『得人者兴,失人者崩』,现在国家、城市乃至公司的竞争,归根结底是人才的竞争,人才越来越成为推动经济社会发展的战略性资源。近日,清华大学 — 中国工程院知识智能联合研究中心隆重发布《智慧人才发展报告》。

该报告经过大数据挖掘找出我国人才发展的痛点,运用知识图谱技术,通过案例研究法,说明智慧人才生态平台对人才队伍建设的积极促进作用,成为该报告的一大看点。将大数据、云计算、人工智能等智能化技术融入到人才大数据挖掘和管理任务中,该报告打造一套智慧人才管理体系和人才生态平台,为提升人[……]

继续阅读

Tianchi 开源数据集

近期,Tianchi 发布了一份非常全面的开源数据集。包含了计算机视觉,自然语言处理,智能金融,智能商务,智能医疗,智能制造,智能农业,智能教育等数据集,非常适合学习和实践。

智能商务

智能交通

智能医疗

工业级 AI 项目落地的挑战

很多人在科研项目中以为机器学习、人工智能就仅仅是模型训练,带有一台性能比较好、带 GPU / TPU 的机器进行模型训练就可以了。如果这么认为,那么只能说明该观点尚处于预研阶段或实验室阶段。在真实的生产环境中,模型训练只是机器学习流程中很小的一个模块,而大部分工作是模型训练之外的工作,如:平台的搭建和配置、数据收集、数据检查、数据转换、模型分析、监控、日志收集和分析、服务发布和更新、迁移训练等。从另外一个方面说,只有当你的科研项目足够充分的考虑到模型在现实环境中的各方面部署需求时,你科研结果 —— 也就是训练出来的模型才具有实际价值,科研成果才有被转换的真正意义上的可行性。

工业 AI,[……]

继续阅读

《大数据白皮书(2020年)》

2020 年 12 月 18 日,由中国信息通信研究院(以下简称“中国信通院”)、中国通信标准化协会大数据技术标准推进委员会主办的:2020 数据资产管理大会,在京召开。会上,中国信通院发布《大数据白皮书(2020年)》。这是中国信通院第五次发布大数据白皮书。白皮书在此前四版的基础上,回顾了去年以来大数据各领域的最新进展,并对“十四五”期间大数据的发展趋势进行了展望。

相关链接:《大数据白皮书(2019年)》[……]

继续阅读

2020 年中国信通院白皮书合集

本合集包括 2020 年度中国信通院发布的 28 本白皮书,打包下载链接

  •   “互联网+行业” 个人信息保护研究报告
  •   工业互联网产业经济发展报告
  •   基于用户体验的移动网络质量白皮书
  •   数字中国产业发展报告(2020年)——信息通信产业篇
  •   中国数字经济发展白皮书(2020)
  •   云计算发展白皮书
  •   中国互联网行业发展态势暨景气指数报告(2020)
  •   中国网络安全产业白皮书
  •   人工智能治理白皮书
  •   中国金融科技生态白皮书(2020年)
  •   全球数字经济新图景(2020年)
  •   中国宽带发展白皮书
  • [……]

    继续阅读

眼底 OCTA 血管分割数据集(ROSE)及新型的血管分割框架

对眼底 OCTA 图像中的血管结构进行提取分割,除了有助于临床医生对许多眼科疾病的诊断外,还有望为观测和评估包括阿尔茨海默氏病(AD)等在内的神经退行性疾病发展开辟新途径。目前基于视网膜 OCTA 图像的自动血管分割研究相对较少,一方面由于 OCTA 图像存在低信噪比、投影伪影等问题,另一方面也缺少公开的 OCTA 血管分割数据集用于训练分割模型,因此 OCTA 图像中血管结构的自动分割仍存在很大的挑战。今天向大家介绍一篇近期发表在 IEEE-TMI 的一篇研究论文,该论文公开了领域内一个为数不多的眼底 OCTA 血管分割数据集(ROSE),并以此为基础提出了用于眼底 OCTA 血管分割的新型[……]

继续阅读

英特尔 AI 制造实战手册

在质量监控、产量提升、故障监控、维保预测、能源管理、机械臂控制以及市场分析预估等使用场景中,越来越多的 AI 软硬件产品及解决方案正发挥越来越大的作用,市场前景广阔。英特尔与众多合作伙伴一起,充分评估一线生产场景的实际状况,一方面为不同场景选择合理的算法,满足检测系统在速度和精度上的需要;另一方面,也推动边缘计算等创新基础设施架构在 AI 应用中的运用,并取得了良好的成效。[……]

继续阅读