|
梅宏院士談大(dà)數(shù)據的(de)現(xiàn)狀與趨勢大(dà)數(shù)據應用(yòng) 按照(zhào)數(shù)據開(kāi)發應用(yòng)深入程度的✔£(de)不(bù)同,可(kě)将衆多(duō)的(de)大(dà)數(shù ✔)據應用(yòng)分(fēn)為(wèi)三個(gè)層≠₽次。 第二層,預測性分(fēn)析應用(yòng),是(shì)指從(cóng)大(d∑≈☆à)數(shù)據中分(fēn)析事(shì)物(wù)之間(jiān∑ )的(de)關聯關系、發展模式等,并據此對(duì)事(sπα÷→hì)物(wù)發展的(de)趨勢進行(xíng)預測。如(rú™δ)微(wēi)軟公司紐約研究院研究員(yuán)Dav× ☆✔id Rothschild通(tōng)過收集和(hé)分(fēn)析賭↕₽&博市(shì)場(chǎng)、證券交易所、社交媒體(tǐ)用(yòng)戶發布的(de)帖子→♦€"(zǐ)等大(dà)量公開(kāi)數(shù)據,建立預測模型,對(duì)多 $(duō)屆奧斯卡獎項的(de)歸屬進行(xíng)預測。2014和♠♥(hé)2015年(nián),均準确預測了(le)奧斯卡共24個(gèλ∏×φ)獎項中的(de)21個(gè)。 當前,在大(dà)數(shù)據應用(yòng)的(de)實踐中,描述性、預測性分★♠(fēn)析應用(yòng)多(duō),決策指導∏"性等更深層次分(fēn)析應用(yòng)偏少(shǎo)。一(yī)般而言,人(rén)們做(✔σ$♥zuò)出決策的(de)流程通(tōng)常÷包括:認知(zhī)現(xiàn)狀、預測未來(lái)和(h♥∑♥εé)選擇策略這(zhè)三個(gè)基本步驟。這(zhè)些(xi₹★ē)步驟也(yě)對(duì)應了(le)上(shàng)述大(dà)數(shù)據分 ∏" (fēn)析應用(yòng)的(de)三個(gè)不(bù)同層次。不(b>™γ©ù)同層次的(de)應用(yòng)意味著(↑←zhe)人(rén)類和(hé)計(jì)算(suàn)機(jī)在♦÷✘決策流程中不(bù)同的(de)分(fēn)工(gōng)'<和(hé)協作(zuò)。例如(rú):第一(yī)層次的(de)描述性分(fēn)析中,計(jì§§)算(suàn)機(jī)僅負責将與現(xiàn)狀相(xiàng)< §•關的(de)信息和(hé)知(zhī)識展現(xiàn)給人(rén)類專家(jiā δ),而對(duì)未來(lái)态勢的(de)判斷及對(duì)最優₽•↑策略的(de)選擇仍然由人(rén)類專家(jiā)完成。應用(yòng)層次越深$¥¶♥,計(jì)算(suàn)機(jī)承擔的(de)任務越多(duō)、越複雜(zá),效率提★<升也(yě)越大(dà),價值也(yě)越大(dà)。然而,随著(¶∞'zhe)研究應用(yòng)的(de)不(∑∞±bù)斷深入,人(rén)們逐漸意識到(dào)前期在大(dà)數(shù)據分(♠'✔♣fēn)析應用(yòng)中大(dà)放(fàng)異 ♦≥彩的(de)深度神經網絡尚存在基礎理(lǐ)論不(bù)完善、模型不(bù)具可(kě)解釋±€性、魯棒性較差等問(wèn)題。因此,雖然應λ♥≥σ用(yòng)層次最深的(de)決策指導性應用(yòng),當前已在人(rén)機(™αjī)博弈等非關鍵性領域取得(de)較好(hǎ↕•↕o)應用(yòng)效果,但(dàn)是(✔γ☆πshì),在自(zì)動駕駛、政府決策、軍事(shì)指揮、醫(yī)療健康等應用(yòng)價≠ 值更高(gāo),且與人(rén)類生(shēng)命、财産、發展和(hé)安全緊"☆≈密關聯的(de)領域,要(yào)真正獲得(de)有(yǒu)效應用(yòβ &ng),仍面臨一(yī)系列待解決的(de)重大(d∏<→à)基礎理(lǐ)論和(hé)核心技(jì)術(shù)挑戰,大(dà)數(shù)據應用(yònσ£εg)仍處于初級階段。 大(dà)數(shù)據治理(lǐ) 随著(zhe)大(dà)數(shù)據作(zuò)為(wèi)戰略資源的γ<£≤(de)地(dì)位日(rì)益凸顯,人(rén)們越來(lái)越強←$烈地(dì)意識到(dào)制(zhì)約大(dà)數(shù)據發展最大(dà)的(¥↕₹↑de)短(duǎn)闆之一(yī)就(jiù)是ε×¶(shì):數(shù)據治理(lǐ)體(tǐ)系遠(yuǎn)未 φ™形成,如(rú)數(shù)據資産地(dì)位的(de)确立尚未達成共識,數(shù)據的(de§✔)确權、流通(tōng)和(hé)管控面臨多(duō)重挑戰;數(shù)據壁壘廣¶≤♥泛存在,阻礙了(le)數(shù)據的(de)共享和(hé)開(kāi)放(fàng α);法律法規發展滞後,導緻大(dà)數(shù)據應用(yòng)存在安全與隐私風(fēng€π )險等。 一(yī)方面,數(shù)據共享開(kāi)放(fàn g)的(de)需求十分(fēn)迫切。近(jìn)年®>'∑(nián)來(lái)人(rén)工(gōng)智能(néng)應用 ∏(yòng)取得(de)的(de)重要(yào)進展,主γ←"↓要(yào)源于對(duì)海(hǎi)量、₽✔高(gāo)質量數(shù)據資源的(de)分(fēn)析和(hé)挖掘。∏δ而對(duì)于單一(yī)組織機(jī)構而言,往往靠自(zì)身(shēn)的(de)₩↑積累難以聚集足夠的(de)高(gāo)質量數(shù)據。 然而,另一(yī)方面,數(shù)據的(de)無序流通(tōng)與共享,又♣↑(yòu)可(kě)能(néng)導緻隐私保護和(hé)數(shù)據> 安全方面的(de)重大(dà)風(fēng)險,必須對(duì)其 ¥♣加以規範和(hé)限制(zhì)。例如(rú),鑒于互聯網公司頻(pín)發★★γ的(de)、由于對(duì)個(gè)人(rén)數(shù)據的(de)不(bù) ™π正當使用(yòng)而導緻的(de)隐私安全問(wèn)題φ™£,歐盟制(zhì)定了(le)“史上(shàng)最嚴格的(de)”數(shù)據安≤™全管理(lǐ)法規《通(tōng)用(yòng)數(shù)據保護條例》♠<。2020年(nián)1月(yuè)1日(<←rì),被稱為(wèi)美(měi)國(guó)“最嚴厲、最全面的(de)個(gè)人(r♦↑ ₽én)隐私保護法案”——《加利福利亞消費(fèi)者隐私法案》(CCPA)正式生(shēng)效₹♠$。在我國(guó),2019年(nián)中央網信辦發布了(le)《數(shù↓≤)據安全管理(lǐ)辦法(征求意見(jiàn)稿)》&↔★,向社會(huì)公開(kāi)征求意見(jiàn),明(míng)确了(le) ★®個(gè)人(rén)信息和(hé)重要(yào)數(shù)據的(de)收集、處理(↔™✔lǐ)、使用(yòng)和(hé)安全監督管理(lǐ)的(de)相(xiàng)關标準和β♥£(hé)規範。 一(yī)是(shì)大(dà)數(shù)據治理(lǐ)概念的(de)使用(yòng₹₽¶<)相(xiàng)對(duì)“狹義”,研究和(hé)實踐大( ÷dà)都(dōu)以企業(yè)組織為(wèi)對(duì)象,僅從(₽'₩'cóng)個(gè)體(tǐ)組織的(de)角度考慮大(dà)數★₹(shù)據治理(lǐ)的(de)相(xiàng)關問(wèn)題,這(≥×zhè)與大(dà)數(shù)據跨界流動的(de)迫切需求存在矛盾,限制(zhì)了( ≤le)大(dà)數(shù)據價值的(de)發♠'§揮。 三是(shì)大(dà)數(shù)據治理(lǐ)相(xiàng)關的(de)研究實踐多(duō γ↔)條線索并行(xíng),關聯性、完整性和(α↑Ωhé)一(yī)緻性不(bù)足。諸如(rú),國(g÷βuó)家(jiā)層面的(de)政策法規和(hé)法'♥φ律制(zhì)定等較少(shǎo)被納入大(dà)數(shù)據治理(lǐ)的(d♠∏e)視(shì)角;數(shù)據作(zuò)為(wèi)一(yī)種資産的(de)地(dìΩ•≤≤)位仍未通(tōng)過法律法規予以确立,難以進行(xíng)有↓±(yǒu)效的(de)管理(lǐ)和(hé)應用(yòng);大(₩ dà)數(shù)據管理(lǐ)已有(yǒu)不(bù)₹✘§少(shǎo)可(kě)用(yòng)技(jì)術(shù)與産品,但(dàn)還(hái)缺乏完¶>善的(de)多(duō)層級管理(lǐ)體(tǐ)制(zhì)和£&$(hé)高(gāo)效管理(lǐ)機(jī)制(zhì);σ↔↓✔如(rú)何有(yǒu)機(jī)結合技(jì)術(shù)與标準,建立良好(hǎo)的(β de)大(dà)數(shù)據共享與開(kāi₽♦₩>)放(fàng)環境仍需要(yào)進一(yī)步探索 φ。 數(shù)據規模高(gāo)速增長(cháng) π,現(xiàn)有(yǒu)技(jì)術(shù)體(tǐ)系難以滿足大(d↓πε>à)數(shù)據應用(yòng)的(de)需求™♣♠,大(dà)數(shù)據理(lǐ)論與技(jì)術(shù)遠(yuǎn)≤≤₹>未成熟,未來(lái)信息技(jì)術(shù)體(tǐ)系将需要(yào)颠覆式創新和(hé)ε變革。 當前,需要(yào)處理(lǐ)的(de)♦§±•數(shù)據量已經大(dà)大(dà)超過處理(™₩∏lǐ)能(néng)力的(de)上(shàng)限,從(cóng)而導緻大(dà)量數(s> hù)據因無法或來(lái)不(bù)及處理(lǐ),而處于未被¶♣÷利用(yòng)、價值不(bù)明(mí±÷≥ng)的(de)狀态,這(zhè)些(xiē)數(shù)據被稱為(wèi)“暗↑ ™(àn)數(shù)據”。據國(guó)際商業(yè)機(jī)器(>λ✔qì)公司(IBM)的(de)研究報(bào)告估計(jì),大(dà)多(duō)數(→♦ shù)企業(yè)僅對(duì)其所有(yǒu)數(shù)據的(∞<☆÷de)1%進行(xíng)了(le)分(fēn)析應用(yòng)。→♦ 首先,大(dà)數(shù)據定義雖已達λ&$成初步共識,但(dàn)許多(duō)本質問(wèn)題仍存在争議(yì★≈β♦),例如(rú):數(shù)據驅動與規則驅動的(de)對(duì)立統一(yī)、“關聯”®€與“因果”的(de)辯證關系、“全數(s€→hù)據”的(de)時(shí)空(kōng)相(xiàn♥ πg)對(duì)性、分(fēn)析模型的(de)可(₽≥" kě)解釋性與魯棒性等; 其三,應用(yòng)超前于理(lǐ)論©↓和(hé)技(jì)術(shù)發展,數(shù)據分(fēn)析的(de)結論往往缺乏堅實的(de)理(lǐ)論基礎,對(duì)這(zhè)些(xi♠αē)結論的(de)使用(yòng)仍需保持謹慎态度。 在此背景下(xià),大(dà)數(shù)據現(xiàn)象倒逼技(♠★jì)術(shù)變革,将使得(de)信息技(jì)術(shù)體(tǐ)系 σ&進行(xíng)一(yī)次重構,這(zhè)也(yě)帶來(lái)了(leΩ∑≠)颠覆式發展的(de)機(jī)遇。 上(shàng)一(yī)篇物(wù)料主數(shù)據經典案例 | 讓每一(yīε£₹)個(gè)量具都(dōu)發揮價值下(xià)一(yī)篇大(dà)數(shù)據與數(shù)字經濟 |