1月13日,國家發展改革委、國家數據局、財政部、人力資源和社會保障部四部門聯合發布《關于促進數據標注產業高質量發展的實施意見》(以下簡稱《意見》)。
什么是“數據標注”?簡單理解,就是給文本、語音、圖片、視頻等等各種各樣的數據“打標簽”。本次印發的文件是國家層面首次對數據標注這一新興產業進行系統謀劃。
年均復合增長率將超20%
數據標注產業向知識密集型轉變
自動駕駛、低空經濟、智能制造、智慧醫療等領域都離不開數據標注。據測算,2023年我國數據標注產業規模達800億元左右。本次發布的《意見》提出,到2027年,數據標注產業專業化、智能化及科技創新能力水平顯著提升,產業規模大幅躍升,年均復合增長率超過20%。培育壯大數據標注產業,對于推動人工智能創新發展具有重要支撐作用。 清華大學計算社會科學與國家治理實驗室執行主任 孟慶國:高質量數據短缺,是我們一些大模型發展過程中遇到的瓶頸,數據標注就是對數據進行篩選、清洗、分類、標記等各種加工處理,能產生高質量的數據集,讓機器讀得懂、學得快、訓得好,F在的一個新趨勢是,數據標注自身的自動化、智能化程度也在明顯提高,與此同時,細分領域變多,也需要金融、交通、能源、醫療等一些背景的專業人才,數據標注正在逐步從傳統的勞動密集型向知識密集型產業轉變!兑庖姟愤提出,建設成效顯著、特色鮮明的數據標注基地,形成相對完善的數據標注產業生態。目前,我國已確定成都、沈陽、合肥、長沙等7個城市承擔數據標注基地建設任務。
|