新闻中心kaiyun体育高质料数据不错更好地模拟客不雅寰宇-开yun体育官网入口登录

新闻中心

你的位置:开yun体育官网入口登录 > 新闻中心 > kaiyun体育高质料数据不错更好地模拟客不雅寰宇-开yun体育官网入口登录

kaiyun体育高质料数据不错更好地模拟客不雅寰宇-开yun体育官网入口登录

发布日期:2025-04-23 04:53    点击次数:102

新闻中心

封面新闻记者 张越熙kaiyun体育 11月 19 日下昼,行业大模子、具身智能、算力、芯片、数据合成等10 项首发效果在乌镇峰会登台路演, 其中 AI 数据合成与分娩平台AIGD(AI Generated Data)因聚焦“数据合成”获粗拙温暖。“往日的AI诳骗需要大量稀缺且难以赢得的长余数据,如自动驾驶中的顶点天气与顶点路况数据,具身智能窥探所需要的复杂场景数据。在此配景下,数据合成成为要害。”蚂蚁数科AI科技本事矜重东谈主、蚂蚁天玑履行室主任李哲现场向记者先容。 AI 发展正濒临着高质料

详情

kaiyun体育高质料数据不错更好地模拟客不雅寰宇-开yun体育官网入口登录

封面新闻记者 张越熙kaiyun体育

11月 19 日下昼,行业大模子、具身智能、算力、芯片、数据合成等10 项首发效果在乌镇峰会登台路演, 其中 AI 数据合成与分娩平台AIGD(AI Generated Data)因聚焦“数据合成”获粗拙温暖。“往日的AI诳骗需要大量稀缺且难以赢得的长余数据,如自动驾驶中的顶点天气与顶点路况数据,具身智能窥探所需要的复杂场景数据。在此配景下,数据合成成为要害。”蚂蚁数科AI科技本事矜重东谈主、蚂蚁天玑履行室主任李哲现场向记者先容。

AI 发展正濒临着高质料数据枯竭的问题。连年来,伴跟着大模子本事的快速发展,机器学习也正从“以模子为中心”转向“以数据为中心”,高质料数据不错更好地模拟客不雅寰宇,升迁模子的准确性和领悟性,然而“到 2026 年,现有的用于 AI 模子窥探的高质料言语数据将消耗”,据Epoch AI Research琢磨团队估量。Gartner 暗示,到 2030 年,合成数据将成为 AI 模子的主要窥探数据开头;2024 年, 60% 的 AI 数据将是合成数据,被用于模拟、估量场景和裁减风险。

记者在2024年寰宇互联网大会乌镇峰会了解到,AIGD平台是由蚂蚁数科陈述的首发效果,平台可通过大鸿沟合成互联网所不掩饰的高质料、高价值垂直语料数据,匡助科技厂商进行 AI 模子窥探。记者了解到,AIGD具备 PB 级数据分娩才调,支合手数据从生成到窥探全经过自动化责罚,自动化率达到 80%,这极大提高了数据责罚的遵循和质料。此外,平台自研15 余种数据合成器具,现在不错合成图片、视频、3D模子、多模态图文视频对、多轮对话、语音书号、心率脑电信号、结构化往来数据等多模态数据,以知足多种诳骗场景下的 AI 模子窥探需求。

业内东谈主士精深以为,“高质料数据”是 AI 大模子久了到产业的短处基础,莫得好的数据作念相沿,一切 AI 诳骗皆是空中楼阁。近日,OpenAI职工爆料说,“新模子‘莫得那么大飞跃’”,主要原因之一即是高质料数据不及所导致的。本年 9 月份, OpenAI 发布推理模子o1,带来了强化学习窥探新范式,通过自博弈强化学习,将合成数据的形态窥探给大模子,从而大幅增多大模子逻辑推理才调。

“数据合成”是蚂蚁数科 AIGD 平台的主邀功能之一,此外还包括数据标注、质检等才调。在数据标注方面,通过东谈主机协同进行标注,东谈主工智能算法粗略自动识别和预责罚大部分基础信息kaiyun体育,预标注模子依赖东谈主工标注量裁减了 70%以上。在数据质检方面,平台会确认元信息支合手不同粒度的数据质料统计,最猛进程贯通数据,保证合成及标注后的数据合适预期质料条目。李哲在乌镇峰会上暗示:“咱们行将迎来 AI 功绩产业的黄金年代,蚂蚁数科将会坚毅在 AI ToB 领域插足,让 AI 久了千行百业。”

官网: www.hfbainuo.com

邮箱: 975acd86@outlook.com

地址: 新闻中心科技园166号

Powered by 开yun体育官网入口登录 RSS地图 HTML地图


开yun体育官网入口登录-kaiyun体育高质料数据不错更好地模拟客不雅寰宇-开yun体育官网入口登录