“数·算·网”交融发展暨粤港澳大湾区(南山·前海)算力奇迹定约第一期调换商量会近日在南山举行。会上,深圳数据来回所发布了大模子考试数据道路图,并集会洞开算料定约发布500个垂直行业多模态算料集。
会上,深圳数据来回所(以下简称“深数所”)东谈主工智能行业利用王吴越进行了主旨发言,并展示了深数所助力粤港澳大湾区东谈主工智能考试场建造的行业膨大。
王吴越示意,在数字经济时期,“数据因素×”与“东谈主工智能+”成为鼓励新质坐褥力的双轮开动,共同引颈着经济社会的朝上与发展。数据动作一个高效的“乘法”因子,唐突与不同业业联结,显贵进步行业的坐褥成果或立异才气,而东谈主工智能技艺则通过“加法”花样为传统产业带来渐进式的更正和优化,股票买卖两者相互交汇,共同成为数字经济发展的双翼。
王吴越先容了以数据为中心的东谈主工智能(Data-Centric AI)发展理念并发布了大模子考试数据道路图。深数所将按照大模子应用的不同阶段(考试、推理、调优),有的放矢地提供数据源,使得国产大模子厂商“寻数有路”。
今日,深数所与洞开算料定约汇注髻布了由37家不同的数据商提供的、首批500个东谈主工智能大模子高质料考试数据集,涵盖12个“数据因素×”范畴、3家谈外数据商、7类数据模态(文本、图像、音频、视频、多模态、3D、GIS等)。本批数据集初度汇聚了来自中国神色局、中国知网、中译语通、万邦同和、微梦数据(新浪微博)、前海数据、海天瑞声、拓尔念念、数据堂、聪惠芽、网智天元、柏川数据、驯顺科技等数据商的数据集动作大模子算料。其中大部分算料为宇宙首发。
会上,深圳数据来回所公开了高质料数据集的真正流畅渠谈。改日,深数所将坚捏立异引颈,为国产大模子厂商提供燃料,并联袂大模子厂商在数据因素×重心活动范畴共建垂直行业大模子数据应用。