中新網北京9月2日電(記者 吳濤)當人工智能的浪潮席卷全球,其背后的“燃料”——數據,正成為競相爭奪的戰略資源。然而,並非所有數據都能加速AI的發展。一場從“海量數據”向“高質量數據集”的變革正在發生。
2024年12月,國家發展改革委、國家數據局等部門印發《關於促進數據產業高質量發展的指導意見》,首次明確提出“高質量數據集”概念,支持企業面向人工智能應用創新,開發高質量數據集,大力發展“數據即服務”“知識即服務”“模型即服務”等新業態。
近日發布的《高質量數據集建設指引》指出,大模型參數規模指數級增長與多模態能力的拓展,數據需求從“量級積累”轉向“量質並重”。
官方數據顯示,截至2025年6月,全國建設高質量數據集超3.5萬個、總量超400PB﹔數據交易機構挂牌高質量數據集3364個,作為交易流通中的關鍵商品,累計交易額近40億元,規模達246PB。
在近日舉行的一場論壇上,中國信息通信研究院院長余曉暉表示,放眼全球,有大量的私域數據,在場景、行業、政府中,這部分數據能夠釋放出來,是構成高質量數據集非常重要的一個方向。
因為AI大模型的訓練會用到海量數據,所以,市場一直有觀點認為,未來將無數據可用,或者不得不用大量的合成數據。在這種情況下,高質量數據集無疑成為數據流通的“硬通貨”。
清華大學數字政府與治理研究院院長、教授張小勁表示,人工智能大模型走到哪裡,高質量數據集就走到哪裡,反之,高質量數據集走到哪裡,人工智能Kaiyun体育官方网站 开云登录网站就走到哪裡,這是相輔相成的,是雙輪驅動的格局。
中开云网址 kaiyun官方入口國工程院院士吳世忠指出,數據集建設的質量和安全,是大模型發展的生命線,要完善分級分類的數據安全制度,強化全流程的技術防護手段,筑牢防篡改的底層技術能力。在數據集建設中,還要主動融入中華優秀傳統文化,避免模型成為利己主義的工具。
目前高質量數據集建設如火如荼,深圳市政務服務和數據管理局黨組書記、局長周劍明在國家數據局官網發文分享,深圳市結合公共數據資源授權運營和可信數據空間建設探索,支持高質量公共數據和企業數據等融合應用,已在征信金融、氣象、商保理賠等領域開展試點,取得較好成效。(完)
財政部、稅務總局發布關於劃轉充實社保基金國有股權及現金收益運作管理稅收政策的通知
人民網北京9月2日電 (記者王震)據財政部網站消息,近日,財政部、稅務總局發布關於劃轉充實社保基金國有股權及現金收益運作管理稅收政策的通知。 相關稅收政策通知如下: 一、對承接主體在運用劃轉的國有股權和現金收益投資過程中,貸款服務取得的全部利息及利息性質的收入和金融商品轉讓收入,免征增值稅。…
人民網北京9月2日電 (記者申佳平)據工業和信息化部官網消息,今年前7個月,我國軟件和信息技術服務業(以下簡稱“軟件業”)運行態勢良好,軟件業務收入、利潤總額穩健增長,軟件業務出口保持正增長。 數據顯示,前7個月,我國軟件業務收入83246億元,同比增長12.3%。…
人民日報社概況關於人民網報社招聘招聘英才廣告服務合作加盟版權服務數據服務網站聲明網站律師信息保護聯系我們
人 民 網 股 份 有 限 公 司 版 權 所 有 ,未 經 書 面 授 權 禁 止 使 用