當(dāng)前,我國數(shù)字經(jīng)濟(jì)進(jìn)入快速發(fā)展新階段,數(shù)據(jù)作為新型生產(chǎn)要素,已成為推動(dòng)經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展的核心驅(qū)動(dòng)力。構(gòu)建完善的數(shù)據(jù)要素市場(chǎng)體系,核心議題之一在于建立數(shù)據(jù)的合理定價(jià)機(jī)制與有效激勵(lì)機(jī)制。
國家層面已為此提供了清晰的制度指引。《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》(“數(shù)據(jù)二十條”)明確提出,要建立體現(xiàn)效率、促進(jìn)公平的數(shù)據(jù)要素收益分配制度,并特別強(qiáng)調(diào)“按價(jià)值貢獻(xiàn)參與分配”。與此同時(shí),《關(guān)于深入實(shí)施“人工智能+”行動(dòng)的意見》進(jìn)一步突出了高質(zhì)量數(shù)據(jù)在人工智能發(fā)展中的基礎(chǔ)支撐作用。隨著人工智能發(fā)展范式從“以模型為中心”轉(zhuǎn)向“以數(shù)據(jù)為中心”,數(shù)據(jù)質(zhì)量已成為決定AI系統(tǒng)能力上限的關(guān)鍵變量。然而,當(dāng)前高質(zhì)量數(shù)據(jù)的供給仍面臨定價(jià)機(jī)制不健全、市場(chǎng)化激勵(lì)不足等現(xiàn)實(shí)挑戰(zhàn)。因此,積極推動(dòng)“為優(yōu)質(zhì)數(shù)據(jù)付費(fèi)買單”,不僅是破解數(shù)據(jù)要素市場(chǎng)化配置瓶頸的迫切需要,更是激活數(shù)據(jù)潛能、支撐人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展的重要戰(zhàn)略舉措。
確立數(shù)據(jù)付費(fèi)機(jī)制的必要性
當(dāng)前數(shù)據(jù)要素市場(chǎng)發(fā)展的核心障礙,在于缺乏一套能夠精準(zhǔn)識(shí)別并回報(bào)數(shù)據(jù)價(jià)值的付費(fèi)機(jī)制。這不僅是一個(gè)定價(jià)問題,更是一個(gè)導(dǎo)致市場(chǎng)失靈、抑制創(chuàng)新并危及人工智能產(chǎn)業(yè)健康發(fā)展的系統(tǒng)性困境。
一是市場(chǎng)機(jī)制待破解,優(yōu)質(zhì)數(shù)據(jù)流通受阻。市場(chǎng)面臨的根本性難題是“雙向價(jià)值不確定性”與定價(jià)失靈。數(shù)據(jù)供給方無法預(yù)知其數(shù)據(jù)將被如何復(fù)用及創(chuàng)造多大價(jià)值,而需求方在交易前也難以驗(yàn)證數(shù)據(jù)質(zhì)量及其對(duì)模型的確切貢獻(xiàn)。這種深度信息不對(duì)稱,使得高價(jià)值數(shù)據(jù)的持有者因擔(dān)心無法獲得公平回報(bào)且面臨泄漏風(fēng)險(xiǎn)而選擇“惜售”,導(dǎo)致高價(jià)值、差異性數(shù)據(jù)資源的有效供給不足。其結(jié)果是,“檸檬市場(chǎng)”效應(yīng)開始顯現(xiàn):劣質(zhì)數(shù)據(jù)將會(huì)擠壓優(yōu)質(zhì)數(shù)據(jù)的生存空間,不僅抑制了市場(chǎng)對(duì)高成本、高價(jià)值數(shù)據(jù)產(chǎn)品的有效需求與合理定價(jià),也最終會(huì)導(dǎo)致數(shù)據(jù)要素的配置效率低下。
二是供給端激勵(lì)不足,高質(zhì)量數(shù)據(jù)“產(chǎn)能”缺失。付費(fèi)機(jī)制的缺位,導(dǎo)致市場(chǎng)缺乏對(duì)高質(zhì)量數(shù)據(jù)生產(chǎn)的有效激勵(lì)。例如專業(yè)數(shù)據(jù)集(如醫(yī)療、科研、工業(yè))的構(gòu)建依賴專家知識(shí)和高成本標(biāo)注,但由于其貢獻(xiàn)難以被市場(chǎng)量化并給予匹配回報(bào),導(dǎo)致相關(guān)主體缺乏持續(xù)投入的積極性。這造成支撐產(chǎn)業(yè)深度智能化的高質(zhì)量、專業(yè)化數(shù)據(jù)集嚴(yán)重供給不足,成為制約人工智能向縱深發(fā)展的瓶頸。
三是需求端被迫妥協(xié),模型與產(chǎn)業(yè)根基受損。在優(yōu)質(zhì)數(shù)據(jù)供給不足且缺乏合理定價(jià)的背景下,人工智能研發(fā)將會(huì)被迫轉(zhuǎn)向大量免費(fèi)但噪聲大的開源網(wǎng)絡(luò)數(shù)據(jù)。這類數(shù)據(jù)往往包含諸多錯(cuò)誤與偏見,用于訓(xùn)練模型不僅效率低,還可能引發(fā)“模型自噬障礙”,導(dǎo)致模型輸出事實(shí)錯(cuò)誤或性能退化。長(zhǎng)期如此,產(chǎn)業(yè)易陷入“低質(zhì)數(shù)據(jù)訓(xùn)練低能模型”的循環(huán),制約技術(shù)進(jìn)步與可靠應(yīng)用。此外,付費(fèi)機(jī)制的缺失也不利于培育基于數(shù)據(jù)深度加工、可信協(xié)作的創(chuàng)新商業(yè)模式,限制了數(shù)據(jù)生態(tài)的活力與多樣性。
建立科學(xué)的數(shù)據(jù)付費(fèi)機(jī)制,是構(gòu)建可持續(xù)數(shù)據(jù)要素市場(chǎng)的基礎(chǔ)。這不僅是為了保障數(shù)據(jù)供給方的合法權(quán)益、明確權(quán)益歸屬,更是為了通過建立規(guī)范透明的價(jià)值實(shí)現(xiàn)渠道,穩(wěn)定市場(chǎng)預(yù)期、促進(jìn)數(shù)據(jù)高效合規(guī)流通,從而充分釋放數(shù)據(jù)要素的價(jià)值,有效賦能數(shù)字經(jīng)濟(jì)發(fā)展。
破局之道:構(gòu)建技術(shù)驅(qū)動(dòng)與機(jī)制保障的數(shù)據(jù)付費(fèi)體系
擺脫前述困境,關(guān)鍵在于構(gòu)建一套技術(shù)驅(qū)動(dòng)、制度保障的數(shù)據(jù)付費(fèi)體系。這需要圍繞“技術(shù)量化價(jià)值、機(jī)制保障分配”的核心思路展開,從技術(shù)路徑、體系構(gòu)建與實(shí)踐借鑒三個(gè)層面系統(tǒng)推進(jìn)。
一是技術(shù)路徑上,從“模糊定價(jià)”走向“精準(zhǔn)量化”。破解數(shù)據(jù)定價(jià)難題,首先要基于前沿技術(shù)實(shí)現(xiàn)從主觀經(jīng)驗(yàn)判斷到客觀貢獻(xiàn)度量的根本轉(zhuǎn)變。傳統(tǒng)定價(jià)方式已難以適應(yīng)數(shù)據(jù),尤其是人工智能訓(xùn)練數(shù)據(jù)所特有的價(jià)值不確定性、場(chǎng)景依賴性和事后驗(yàn)證性。
破局需要發(fā)展并融合兩類關(guān)鍵技術(shù):一是基于貢獻(xiàn)認(rèn)定的價(jià)值量化技術(shù),其核心是運(yùn)用合作博弈理論等方法,通過計(jì)算特定數(shù)據(jù)對(duì)模型性能提升的平均邊際貢獻(xiàn),為公平收益分配提供客觀的量化依據(jù);二是面向規(guī)模化應(yīng)用的智能評(píng)估系統(tǒng),能夠?qū)A繑?shù)據(jù)進(jìn)行自動(dòng)化質(zhì)量篩查與價(jià)值預(yù)判,實(shí)現(xiàn)“算法優(yōu)化數(shù)據(jù)輸入”,從源頭提升數(shù)據(jù)質(zhì)量與訓(xùn)練效率。
二是體系構(gòu)建上,以基礎(chǔ)設(shè)施為載體,落實(shí)數(shù)據(jù)賬單與激勵(lì)機(jī)。技術(shù)路徑解決了價(jià)值“如何量化”的問題,而要將這一客觀依據(jù)轉(zhuǎn)化為有效激勵(lì),則必須將其有機(jī)融入新型數(shù)據(jù)基礎(chǔ)設(shè)施與制度設(shè)計(jì)。
當(dāng)前,我國推進(jìn)的可信數(shù)據(jù)空間等基礎(chǔ)設(shè)施,在保障數(shù)據(jù)安全合規(guī)流通的基礎(chǔ)上,應(yīng)進(jìn)一步升級(jí)為“綜合價(jià)值樞紐”。這需要在基礎(chǔ)設(shè)施中深度集成數(shù)據(jù)價(jià)值評(píng)估與基于貢獻(xiàn)度的收益分配模塊,使數(shù)據(jù)在流通過程中同步完成價(jià)值認(rèn)定與收益清算,從而系統(tǒng)性化解交易中的信息不對(duì)稱與信任難題。
這一升級(jí)的核心體現(xiàn),是構(gòu)建依托基礎(chǔ)設(shè)施的“數(shù)據(jù)賬單”體系。該體系需兼顧成本合理補(bǔ)償與收益公平分享,在成本側(cè),可借助數(shù)據(jù)資產(chǎn)圖譜等技術(shù),建立透明可信的成本歸集機(jī)制;在收益?zhèn)龋瑧?yīng)嚴(yán)格遵循“貢獻(xiàn)決定報(bào)酬”原則,在具體應(yīng)用場(chǎng)景中依據(jù)客觀評(píng)估的貢獻(xiàn)度,自動(dòng)執(zhí)行收益的精準(zhǔn)計(jì)算與分配,生成各方可核驗(yàn)的可信賬單,從而構(gòu)建持續(xù)激勵(lì)高質(zhì)量數(shù)據(jù)供給的正向循環(huán)。
此外,國際上在數(shù)據(jù)協(xié)作與付費(fèi)機(jī)制方面的先行探索,為我國構(gòu)建自身體系提供了寶貴的實(shí)踐參考,印證了相關(guān)技術(shù)路徑與機(jī)制設(shè)計(jì)的必要性與可行性。
攜手共建數(shù)據(jù)價(jià)值充分釋放的新格局
為優(yōu)質(zhì)數(shù)據(jù)建立科學(xué)的付費(fèi)機(jī)制,是對(duì)數(shù)字經(jīng)濟(jì)發(fā)展未來和人工智能產(chǎn)業(yè)健康成長(zhǎng)的戰(zhàn)略性、長(zhǎng)期性投資。構(gòu)建一套公平、有效的數(shù)據(jù)評(píng)估與計(jì)價(jià)體系,是破解“檸檬市場(chǎng)”效應(yīng)和“雙向價(jià)值不確定性”難題的根本路徑。
基于貢獻(xiàn)度評(píng)估的定價(jià)與收益分配機(jī)制,為貫徹落實(shí)“數(shù)據(jù)二十條”精神提供了清晰可行的技術(shù)方案。通過在新型數(shù)據(jù)基礎(chǔ)設(shè)施中系統(tǒng)性集成價(jià)值評(píng)估功能,建立可追溯成本、可量化貢獻(xiàn)、可公平分配收益的“數(shù)據(jù)賬單”體系,能夠有力促進(jìn)高質(zhì)量數(shù)據(jù)的持續(xù)供給與高效配置,為深入實(shí)施“人工智能+”行動(dòng)奠定堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
期待社會(huì)各界進(jìn)一步凝聚共識(shí),將數(shù)據(jù)資源的戰(zhàn)略性投入視同關(guān)鍵技術(shù)的研發(fā)投入,共同推動(dòng)基于貢獻(xiàn)度評(píng)估的定價(jià)與收益分配體系的建設(shè)與應(yīng)用。以此,充分釋放數(shù)據(jù)要素潛能,使其真正成為發(fā)展新質(zhì)生產(chǎn)力、驅(qū)動(dòng)經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展的核心引擎,攜手共同邁向數(shù)據(jù)價(jià)值充分涌流、數(shù)字經(jīng)濟(jì)繁榮發(fā)展的新時(shí)代。(作者系清華大學(xué)交叉信息核心技術(shù)研究院常務(wù)副院長(zhǎng))
(人民網(wǎng)記者許維娜 整理)
【相關(guān)閱讀】
之一:建立優(yōu)質(zhì)數(shù)據(jù)付費(fèi)流通機(jī)制 推動(dòng)高質(zhì)量數(shù)據(jù)價(jià)值釋放