您现在的位置是:仿生皮肤智能交互 > 热点
海天瑞声CEO李科:数据产业正从劳动密集型向技术和知识密集型转变
仿生皮肤智能交互2025-09-18 02:42:31【热点】0人已围观
简介专题:2025 INCLUSION·外滩大会:重塑创新增长炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!新浪科技讯 9月13日下午消息,在2025Inclusion·外滩大会
专题:2025 INCLUSION·外滩大会:重塑创新增长
炒股就看金麒麟分析师研报,海天权威,瑞声专业,科数及时,据产集型全面,业正助您挖掘潜力主题机会!从劳
新浪科技讯 9月13日下午消息,动密在2025 Inclusion·外滩大会“Data meets AI:智能时代的向技型转双引擎”见解论坛上,产学界的术和多位权威专家给出了新解法:数据驱动了AI发展,AI也让数据迎来了新一轮的知识进化,双引擎融合驱动才是密集演进方向。
复旦大学教授肖仰华指出,海天当前大模型发展正面临严峻的瑞声“数据墙”困境,无标签语料对模型性能提升的科数贡献日益减弱,更大规模数据带来的据产集型性能提升与所需的训练开销相比性价比显著降低。他认为,大模型数据科学需要从专家经验阶段发展到量化科学、直至自进化阶段。“大模型的数据实践需要屠呦呦式的研究,从海量杂乱的数据中提取出决定模型能力的关键成分”。
肖仰华分享了通过语法复杂度指标和累积分布采样方法筛选高质量语料的实践,实验表明,从100亿个token的财经语料中仅筛选20%的高质量数据进行训练,对模型进行持续预训练,相比于全量数据持续预训练,在领域问答任务上的准确率提升1.7%。
上海交通大学特聘教授翟广涛强调无论是精炼数据还是合成数据,都需要质量优先,而数据质量分析要从“体验质量”入手,考虑人的体验,也考虑机器的体验,进而在数据为中心的范式下进一步提升大模型性能。
海天瑞声CEO李科从产业实践角度分享了全球AI数据行业的发展趋势。他认为,数据产业正在经历从劳动密集型向技术密集型和知识密集型的重大转型。通过动捕数据、自动驾驶标注、思维链数据集等多个实际案例,李科展示了高质量数据如何服务千行百业。
上海库帕思科技有限公司董事长山栋明说,模型之变引领“数据质变”,他表示高质量数据集应满足VALID²(鲜活度、真实性、大样本、完整性、多样性、高知识密度)要求,并详细介绍了语料数据在方法论、基础设施和行业生态三个方面的体系化重构探索。(罗宁)

责任编辑:常福强
很赞哦!(5)
下一篇: 萧县:强化监督促整治 人居环境再提升
热门文章
站长推荐
友情链接
- 新疆维吾尔自治区公共资源交易中心副主任薛建强接受审查调查
- 美团:外挂侵害骑手公平接单权益,法院诉前禁令及时“喊停”
- 2020年北京马协初级、中级1星马术教练考级培训班报名开启
- 中国马术优(U)青计划
- “壮美大草原·幸福鄂托克”提振乡村振兴士气赛马+摄影活动举行
- 新型失眠药达利雷生中国Ⅲ期临床数据发表国际睡眠医学顶刊SLEEP:每晚一片改善睡眠维持、加快入睡
- REDMI K Pad官宣:性能最强小平板 挑战iPad mini
- 《合金装备3:重制版》RTX 4060测试 带不动1080P最高画质
- 你的名字,是我读过最短的情诗(七夕朋友圈文案来啦)
- Mayor Brandon Johnson dodges MSNBC host's questions about police presence
- 乌称使用无人机袭击俄鞑靼斯坦共和国无人机存储仓库
- 华为:AI推理创新技术UCM将于今年9月正式开源
- Sydney Sweeney jeans ad signals major cultural shift in advertising
- “希望杯”全国数学邀请赛
- 稳定!布朗尼出生时詹姆斯场均27+7 现在场均26+7
- 哈马斯代表团抵达开罗进行停火磋商
- 这根“高危的飞线”怎么治?记者调查后发现……
- 2023年四川内江中考作文题目:坚守
- 马主题电影《哈日夫》获金鸡奖两项提名
- 《银河战士Prime4》确认将于今年晚些发售 8月在加拿大提供试玩