今年全國兩會期間,全國政協委員、微博CFO曹菲帶來一份《關于促進AI數據交易市場發展以及加快數據跨境流動規范實施的提案》
曹菲委員表示,自2022年底以來,OpenAI推出的ChatGPT和今年2月推出的Sora視頻生成模型被認為是通向通用人工智能(AGI)的重要里程碑。當前,人工智能處于新一輪技術、應用大爆炸的發展早期,是難得的發展機遇期。快速跟進世界先進AI能力,對于國內各行各業未來的產業升級具有巨大的戰略意義。
數據、算法、算力是AI發展的三個主要要素,海量的優質公開數據是推動先進大模型發展的關鍵因素。據統計,2022年我國國內數據交易規模為人民幣870億,占當年亞洲整體數據交易量的60%以上,處于亞洲領先水平,但與北美和歐盟相比尚有差距。2022 年全球數據交易規模在約 906億美元,預測至2025年有望增長到1445億美元,到 2030年有望達到 3011億美元。2022年美國數據交易市場的市場規模約為 417億美元,是全球數據交易市場規模最大的國家,未來其數據中心的建設規模預計仍會增加。不同于我國數據交易以金融業占比最高(35%)美國數據交易的頭部企業全部為互聯網企業。反觀我國,目前AI企業在優質數據的獲取方面仍存在難度,這在一定程度上阻礙了AI能力的進展。為推動創新企業能夠合法合理地獲取可公開的優質數據,建議在充分保護用戶隱私和數據安全的前提下,國家能夠出臺相關促進政策,大力促進“AI數據交易市場”的形成,使得高質量的海量數據獲取不再成為制約大模型技術發展的瓶頸。
國家充分重視數據交易工作,國務院在2022年12月印發《關于構建數據基礎制度 更好發揮數據要素作用的意見》。2023年10月國家數據局正式掛牌成立,數據交易的監管主體得到明確。各地目前也成立了不少通用型數據交易所,但據統計超一半數據交易機構當前處于沉寂期階段,只有18%機構處于持續活躍期(截止到2023年5月,參考資料1)。由于AI數據需求具有緊迫性和獨特性(文本、圖片、視頻等多種模態/高質量數據需求/標注數據需求等)需要有專門的AI數據交易市場承接該需求。
曹菲委員認為,同時在保證國家安全的前提下也需要進行跨境數據流動。跨境數據交易在美國、歐洲等主要數據市場相當普遍,尤其在互聯網時代,數據作為資產的一個重要類別,其流動性已經成為全球經濟的重要組成部分。跨境數據流動有助于:1)促進全球貿易和經濟合作,推動經濟發展;2)促進不同國家之間的技術交流和合作,推動創新的跨國合作項目;3)通過數據交易企業可以更好地了解國際市場需求和趨勢從而提升企業競爭力;4)促進國際合作與交流,加強各國之間的相互理解以及合作基礎。相關部門也意識到數據跨境流動的必要性并出臺了一些相關法規和管理辦法,包括:2022年7月7日,國家互聯網信息辦公室公布《數據出境安全評估辦法》,自2022年9月1日起施行;2023年9月28日,國家互聯網信息辦公室發布《規范和促進數據跨境流動規定(征求意見稿)》;2023年12月7日,國務院發文,企業和個人因業務需要確需向境外提供數據,且符合國家數據跨境傳輸安全管理要求的,可以向境外提供。據了解國家相關部門正在整理和調研,準備出臺《規范和促進數據跨境流動新規》。
曹菲委員建議:
建立AI數據交易市場: 政府主導建立國內數據交易市場,為AI企業提供一個合法、透明、高效的平臺,以便購買和交易優質數據資源。
制定數據交易規范: 制定和完善相關的數據交易法律法規和標準,明確數據交易的權利義務,保護數據提供方和數據購買方的合法權益。
支持數據開放與共享: 政府應該鼓勵和支持各行業、各領域的數據開放與共享,促進數據資源的充分利用和價值最大化。
加強數據安全保護: 在推動數據開放與共享的同時,政府也應該加強數據安全保護,建立健全的數據安全管理制度,確保數據的安全可控。
培育數據交易生態環境: 政府應該積極引導和支持數據交易相關企業和組織的發展,培育健康、活躍的數據交易生態環境,推動數據交易市場的持續健康發展。
數據出境法律保障:盡快出臺《規范和促進數據跨境流動新規》并優化企業申報程序。
參考資料1: 全國數據交易機構統計及累計交易額 ,https://zhuanlan.zhihu.com/p/631335041
(作者為全國政協委員、微博CFO曹菲)