数据智能政策与产业综述
来源:高新院 achie.org 日期:2025-09-30 点击:次
近年来,智能领域迎来“量变引发质变”的临界点,相关技术、产业进入剧烈变革期。自1956年人工智能(AI)概念诞生以来,智能计算领域历经多个阶段的技术方向探索,逐渐收敛在深度学习这一主线,但仍以“决策式人工智能”为主要发展领域。近两年,在以Transformer模型为代表的算法、极致算力支撑下的千亿级模型参数、大规模高质量数据集三者共同的作用下,生成式大语言模型的应用效果出现跨越式提升。以GPT、DeepSeek为代表的大模型能实时对图像、音频、视频等多种形式输入进行理解,根据要求完成高效问答、内容生成等多种任务,由此“生成式人工智能”及相关应用的发展成为全球焦点,带动人工智能技术产业进入剧烈变革期。
伴随智能领域变革,“数据”与“智能”间的发展关系亦呈现两点重要变化,一是“智能”将成为“数据”价值释放的主要路径,数据将成为智能成效进一步跃迁的胜负手,二是智能化技术开始反向助力数据技术发展和非结构化数据应用。数据与智能正加速融合,由此“数据智能”的概念也应运而生。数据智能的概念可以初步概括为,以全形态数据为关键资源,以大数据和人工智能深度融合后的新技术体系为关键手段,以决策式、生成式人工智能和传统数据应用形式协同应用于生产生活各领域为最终目标,由此形成的新兴生产生活方式,以及相应延展出的新技术、新产业、新生态。
数据智能不仅提升了决策效率和资源配置能力,还推动了创新和用户体验的提升。数据智能技术能够将海量数据转化为具有深度洞察力的知识和决策依据,提升决策效率、优化资源配置,为各行业带来前所未有的价值和变革,成为推动全球数字化转型的核心引擎。数据智能将逐渐为企业、产业、社会等各层面带来新的价值和意义。
在企业层面,数据智能的实践能提升企业从数据中提取有效信息、精炼转化为知识、最终指导决策这一过程的总体效率。在产业层面,数据智能的实践在直接带动相关技术服务产业发展的同时,还将带来模式创新和对生产关系的重塑,改善产业链总体产出效率。在社会层面,数据智能的实践能直接提升信息、知识在全社会范围内的流动效率,同时借由对信息的互通和技术的应用强化总体协同性,优化社会资源的配置效率。
数据智能的快速发展促使全球多国综合考虑发展与监管,加快相关政策出台。
美国出台法案推动人工智能研发创新和应用落地。 2023年5月,白宫更新了《国家人工智能研发战略计划》,旨在加大联邦政府在人工智能研发方面的投资,确保美国在开发和使用可信赖人工智能系统方面继续保持全球领先地位,并为未来的人工智能研发做好准备。2024年3月,美国白宫管理和预算办公室(OMB)发布《推进联邦机构使用人工智能的治理、创新和风险管理》指导意见,旨在规范联邦机构在使用人工智能时的治理、创新和风险管理,确保AI使用的合规性和风险管理。
欧洲建立人工智能监管框架规范AI的开发和利用。欧盟《人工智能法案》于2024年8月1日正式生效,是全球首部全面监管人工智能的法律,将人工智能系统划分为“不可接受风险”、“高风险”、“有限风险”和“低风险”四类,并对高风险AI系统提出包括风险缓解措施、数据集质量、用户信息透明度和人工监督等在内的严格要求。2025年3月,英国正式提出《人工智能(监管)法案》,主要内容包括设立人工智能管理局、明确监管原则、推动监管沙盒计划、规定透明度与知识产权义务等,希望在促进创新的同时,确保人工智能技术的安全性、可靠性、公平性与可追责性。
日韩通过制定战略规划为AI产业提供政策支持和法律保障,鼓励技术应用、创新和产业发展。韩国制定《人工智能基本法》,通过设立国家人工智能委员会和人工智能安全研究所、为AI研发、科研数据集构建及人工智能中心建设提供支持、明确处罚规则等手段构建一个系统化的AI监管框架,同时为AI产业提供政策支持和法律保障。日本出台《人工智能运营商指南》对人工智能开发人员、供应商和业务用户提出安全要求,包括但不限于确保人工智能系统的透明性和可解释性、提升数据质量、加强隐私保护以及建立有效的风险管理系统,降低数据隐私、偏见、安全性等风险。
我国发布一系列政策文件,为数据智能产业发展注入强劲动力。国家层面,2023年8月施行的《生成式人工智能服务管理暂行办法》及2024年9月发布的《人工智能生成合成内容标识办法(征求意见稿)》等法规,明确了生成式人工智能“提供者”在内容生产、数据保护、隐私安全等方面的法定责任及法律依据,要求网络信息服务提供者对AI生成的合成内容进行标识,为人工智能技术的规范发展提供了明确的法律依据。2023年12月发布的《“数据要素×”三年行动计划(2024—2026年)(征求意见稿)》,部署了推动高质量数据集建设、支持大模型训练与应用、优化数据流通环境、推动数据要素与行业结合等一系列行动,推动人工智能技术与各行业的深度融合,为数字经济的高质量发展提供有力支撑。2025年5月,国家数据局发布《数字中国建设2025年行动方案》,方案部署了“人工智能+”、数据产业培养等八项重点行动,旨在通过技术创新和应用场景拓展,赋能千行百业,加速经济社会的数字化转型和高质量发展,推动各行业的智能化升级。地方层面,北京、上海、深圳、江苏、山东等省市纷纷出台人工智能、大模型、数字经济相关政策,通过建设智算中心、打造示范性应用项目、设置人工智能创新发展试验区等方式,推动数据智能在不同领域的应用和发展,为数据智能产业的健康发展提供了有力的政策支持,突显出各地在数据智能领域布局的积极性。
企业层面,全球数据智能产业相关企业加速涌现,企业总量超三万家。据中国信通院统计,截至2024年12月,全球共有数据智能企业31490家,其中,美国企业达11090家,占全球总数的35%,中国企业4696家,占全球总数的15%。从地域看,我国数据智能企业主要集中在经济发达地区。北京、广东、上海、浙江四省市数据智能企业数量合计占全国数据智能企业数量的76%,东部10省市数据智能企业数量超4000家,约占全国数据智能企业的87%。未来,随着大模型技术在各行业领域的落地应用,数据智能企业数量将持续增长,支撑产业规模持续扩大。
投融资层面,数据智能企业投融资活跃,融资金额创历史新高。最近一年,随着大模型技术应用快速发展,数据智能产业受到资本持续关注,融资金额创历史新高。2024年全球数据智能融资金额达1098亿美元,同比增长达117%,融资笔数达6190笔,同比下降6%。全球数据智能融资占全行业融资比例再次上升并创下新高。数据智能融资占全行业融资比例从2022年的6.1%上升至2024年的13.6%,并在2025年Q1进一步升至24.4%。资本市场对于数据智能产业的良好预期,对于产业新增长点的投资带动作用非常显著,月之暗面、智谱AI、xAI、Athropic等为代表的一批数据智能领域企业在2024年均完成大笔融资。面对数据智能应用在资本市场和用户市场的火热态势,国内外科技巨头也纷纷入场,国外以微软、谷歌、Meta等为代表,国内以阿里、字节跳动等为代表,一方面积极研发企业级数据智能相关产品,另一方面以开放接口等方式与其他企业合作开发应用,加速构建数据智能产业生态。
科研层面,全球数据智能领域高水平论文发文量逐年增加,中美专利授权量领跑全球。论文方面,2014-2024年,全球数据智能领域高水平论文发文量逐年增加,总量超14000篇,其中2024年全球数据智能领域论文发布量超25万篇,高水平论文达1941篇。中国高水平论文自2019年超过美国后逐年上升,2024年发文量达1100篇,美国为486篇。10年来,中国论文发文量超51万篇,美国发文量超30万篇,印度、英国、德国分列第三、第四、第五位,中国整体发文量高于美国,但美国企业科研更为活跃,科技巨头微软、谷歌、IBM分别发文5971篇、5363篇、3786篇。专利方面,全球数据智能专利授权比例显著提升,2019-2021年,全球数据智能专利授权量占申请量的比例不足30%,2022-2024年,这一比例提升至58%。从国家来看,全球数据智能专利申请和授权量集中在中美两国,10年来,中国专利授权量超35万,美国授权量超14万,其他国家专利数量与中美差距较大,韩国、日本、德国分列第三、第四、第五位。
人才层面,美中两国成为全球数据智能人才聚集高地,人才培养体系正加速构建。随着各国在数据智能领域竞争的日益激烈,人才正成为推动产业生态发展、抢占国际领先地位的核心资源,不管是企业端还是高校机构,对数据智能人才的重视度都在不断增加。据美国保尔森基金会发布的报告显示,中国和美国是顶级数据智能人才的主要来源地和目标工作地,70%的顶级数据智能人才在中国或美国的机构中工作,65%的顶级数据智能人才出自中美两国。中国是全球最大的顶级数据智能人才输出国,在中国接受本科教育的顶级(前20%)数据智能人才占全球47%,GPT-4团队的核心贡献者名单中,约20%的研究人员来自中国。
随着产业和技术的持续发展,数据智能产业内涵逐步清晰,包括数据、算法、应用、安全四大核心领域。四大领域相辅相成、紧密协作,构筑了数据智能产业的完整链条。
数据是数据智能产业的基石。高质量的数据能够帮助模型更准确地学习和预测,决定了模型的精度与应用的可靠性,为数据智能实践奠定坚实基础。
算法是数据智能产业的引擎。从机器学习到深度学习,从强化学习到生成式大模型,算法的每一次突破都为数据智能带来了新的可能性。高效的算法能够更好地挖掘数据中的价值,提升模型的效率和准确性,为数据智能实践提供核心动力。
应用是数据智能产业的牵引。应用是数据智能产业从技术理论形成生产力的关键。将数据智能应用到企业运营效率提升、用户体验优化、业务模式创新后,数据智能产业才能持续获得投入,才具备长期发展的生命力。
安全是数据智能产业的保障。随着数据智能应用的广泛普及,数据泄露和针对模型的恶意攻击的风险也随之增加。完善的安全技术能够有效抵御这些威胁,防止数据被非法获取、篡改或滥用,为数据与AI融合新范式保驾护航。
本文节选自大数据技术标准委员会于2025年6月18日在“2025数据智能大会”上发布的《数据智能研究报告(2025年)》。