為(wèi)什(shén)麽你(nǐ)的(de)數(shù)據分(fγ§ēn)析成果總是(shì)難以落地(dì)?數(shù)據分(fēn)"↔∞✘析的(de)價值總是(shì)遠(yuǎn)遠(yuǎn)低(dī)于預期?相(xiàng)信♥€ <看(kàn)完這(zhè)篇文(wén)章(zhāng),每個' (gè)人(rén)都(dōu)能(néng)找到(dào€₽)一(yī)個(gè)屬于自(zì)己的(deσφ£)答(dá)案。本人(rén)先後在電(diàn)力、軍工(g÷↑ōng)、金(jīn)融等行(xíng)業(yè)擔任數(shù)據分(fēβΩ≠n)析師(shī),有(yǒu)多(duō)年(nián)行(xíng)業(yè)經£©≠驗。從(cóng)平時(shí)的(de)工(gōng)作(zuλ≥"&ò)中總結出以下(xià)六個(gè)數(shùΩ>✔)據分(fēn)析時(shí)要(yào)注意的(de)原則,希望能(né®ε↔φng)對(duì)大(dà)家(jiā)有(yǒu)所幫助。
1、遵循數(shù)據分(fēn)析标準流程
數(shù)據分(fēn)析遵循一(yī)定的(de)流程,不(bù)僅≤↕→∏可(kě)以保證數(shù)據分(fēn)析每一(yī)個(gè)階段的(de←∞)工(gōng)作(zuò)內(nèi)容有(yǒu)章(zhāng)可(kě)循, ↔☆α而且還(hái)可(kě)以讓分(fēn)析最終的(de)εφ ↓結果更加準确,更加有(yǒu)說(shuō)服力。一(€γΩyī)般情況下(xià),數(shù)據分(fēn)析分(fēn)為(wèi)以下(xià)幾β'↕↓個(gè)步驟:
1) 業(yè)務理(lǐ)解,确定目标、明(m•©★íng)确分(fēn)析需求;
2) 數(s™hù)據理(lǐ)解,收集原始數(shù)據、描述數(s↓☆✘hù)據、探索數(shù)據、檢驗數(shù)據質量;
3) 數(shù)'✔$✘據準備,選擇數(shù)據、清洗數(shù)據、構造數(shù)據、整合數¥✘(shù)據、格式化(huà)數(shù)據;
4) 建立模型,選擇建模技(jì)術✔÷(shù)、參數(shù)調優、生(shē↑γng)成測試計(jì)劃、構建模型;
5) 評估模型,對(d♣uì)模型進行(xíng)較為(wèi)全面的(de)評價,評價結果≥♠、重審過程;
6) 成果部署,分(fēn)析結果應用(yò☆&ng)。
2、明(míng)确數(shù)據分(fēn)析目标
在數(shù)據分(fēn)析前期,要(yào)做(zε>uò)到(dào)充分(fēn)溝通(tōng)、理(lǐ)解業(yè)務規則、關注業(yè)務痛γ<點、了(le)解用(yòng)戶需求、換位思考,明(míng)确為(wèi)什(shΩ σén)麽要(yào)做(zuò)數(shù)據分(f< ēn)析,要(yào)達到(dào)一(yī)個(gè)什(shén)麽 φε₹目标。這(zhè)樣才能(néng)保證後續的(de)↓♣≠收集數(shù)據、确定分(fēn)析主題、分(fēn)析數(shù)據、分(fēn)析γ☆← 結果應用(yòng)等工(gōng)作(zuò)都(dōu)能(n₹↕¥éng)夠圍繞分(fēn)析目标開(kāi)展,保證最終能(nén♠∞★g)夠從(cóng)整體(tǐ)目标的(de)角度去®★(qù)總結分(fēn)析成果。
3、業(yè)務與數(shù)據結合确定分÷≠>₽(fēn)析主題
以解決業(yè)務問(wèn)題為(wèi)目标,以數(shù↕¥)據現(xiàn)狀為(wèi)基礎,确定分( ♣fēn)析主題。前期要(yào)做(zuò)好(hǎo)充分(fēn)的(de)準備,以業↓→λ✔(yè)務問(wèn)題為(wèi)導向,以業(yè)務梳理(lǐ)為(wèi ₽δ)重點,進行(xíng)多(duō)輪討(tǎo)論,分(fēn)析主題避免過大(dà),針對≠&(duì)業(yè)務痛點,實現(xiàn)"★γ知(zhī)現(xiàn)狀、明(míng±∞)原因、可(kě)預測、有(yǒu)價值。另外(wài),分(fēn)析數(shù)據<£&的(de)範圍除了(le)重點關注的(d β←e)業(yè)務指标數(shù)據,還(h→≠ái)要(yào)盡量考慮擴展外(wài)延數± "(shù)據,比如(rú)經濟指标數(shù)據、氣象數→✘&(shù)據、财務數(shù)據等。确定分(fēn)析主題之前,要(yào)"¥≠✘進行(xíng)數(shù)據支撐情況的(de)初步判斷,避免中途發現(x®φ iàn)數(shù)據質量或者數(shù)據範圍不(bù)能(néng)支撐分(fēn)析≈ 工(gōng)作(zuò)的(de)情況發生•↑±(shēng)。确定分(fēn)析主題之後,詳細論證分(fēn)析可(kě)行(x>♠ íng)性,保證分(fēn)析過程的(de)清晰性,才能(<₹néng)開(kāi)始分(fēn)析工(gōng)作(zuò)。
4、多(duō)種分(fēn)析方法結合
分(fēn)析過程中盡量運用(yòng)多(duō)種分(f•✔ēn)析方法,以提高(gāo)分(fēn)析的(de)÷λ≤↓準确性和(hé)可(kě)靠性。例如(rú),運用(yòng)定性定量相(xiàng)結合的(¶β>♥de)分(fēn)析方法對(duì)于數(shù)據進行(xíng)分(fēn)析;♦÷融合交互式自(zì)助BI、數(shù)據挖掘、自(zìε™)然語言處理(lǐ)等多(duō)種分(fēn)>∞析方法;高(gāo)級分(fēn)析和(hé)∞ β☆可(kě)視(shì)化(huà)分(fēn)π↔析相(xiàng)結合等。
5、選擇合适的(de)分(fēn)析工(gōng)具
工(gōng)欲善其事(shì),必先利其器(qì),數(shù)據分(fēn)析過程中要(yà♠₹&£o)選擇合适的(de)分(fēn)析工(gōng♥₽)具做(zuò)分(fēn)析。SPSS、SAS、Alteryx、美(♥↔'měi)林(lín)Tempo、RapidMiner、R、Pytβ'hon等這(zhè)幾種工(gōng)具都(dōu)是(shì)業(yè)界比↓↔®↕較認可(kě)的(de)數(shù)據分(fē←<n)析産品。它們各有(yǒu)其優勢,SPSS ₹'較早進入國(guó)內(nèi)市(shì)場(chǎng),發展已經 ₩相(xiàng)對(duì)成熟,有(yǒu)&☆∑α大(dà)量參考書(shū)可(kě)供參考,操作(zuò)>φ上(shàng)容易上(shàng)手,簡單易學。SAS由于其功能(néng)強大(dà)↓♠✔而且可(kě)以編程,很(hěn)受高(gāo)級用(yòng)戶的(de)歡迎。Alteryx 工(gōng ☆)作(zuò)流打包成應用(yòng),為(wèi)小(xiǎo)企業 ₽∑★(yè)直接提供應用(yòng),地(dì)理(l"<>♣ǐ)數(shù)據分(fēn)析功能(né¥♣€≠ng)強大(dà)。美(měi)林(lín)數(shù)據的(d₩δe)Tempo大(dà)數(shù)據分(fēn)析平台功能(n™≈πéng)全面,在高(gāo)級分(fēn)析和(hé)可(kě)視☆®(shì)化(huà)分(fēn)析相(xiàng)結合上(shàng)具有(yǒu)©₩→明(míng)顯優勢。RapidMiner易用(yòng)性和(h"£✔'é)用(yòng)戶體(tǐ)驗做(zuò)得(de)很(hěn)好(hǎo),并且內←♦σ(nèi)置了(le)很(hěn)多(duō)案例用(yòng)戶可(€♠λ☆kě)直接替換數(shù)據源去(qù)使用(yòδ∞γng)。R 是(shì)開(kāi)源免費(fèi)的(©αde),具有(yǒu)良好(hǎo)的(de)擴展性和(hé)豐富的(de)資源,★涵蓋了(le)多(duō)種行(xíng)業(yè)中數(shù€γ≠₩)據分(fēn)析的(de)幾乎所有(yǒu)方法,分(fēn)析 $數(shù)據更靈活。Python,有(yǒu)各種各樣功能(néng)強大(dà)的(de)庫,☆§↕做(zuò)數(shù)據處理(lǐ)很(hěn)方便,跟MATLAB很(hěn)像。♦€Ω£
6、分(fēn)析結論盡量圖表化(huà)
經過嚴謹推導得(de)出的(de)結論,首先要(yào)精簡明(míng)确,γ↑3-5條即可(kě)。其次要(yào)與業(yè)務問(wèn)題結合,給出解決方案或建議(yì)•£方案。第三盡量圖表化(huà),要(yào)增強其可(kě)讀(dú)性。

利用(yòng)美(měi)林(lín)數(shù)據Tempo大(dà)數(s∞✔hù)據分(fēn)析平台實現(xiàn)的(deΩ≥¥✔)某企業(yè)KPI分(fēn)析報(bào)告
數(shù)據分(fēn)析過程中,除了(le)以βπ§₹上(shàng)六條原則,還(hái)要(yào)避免以下(xià)3種情況:
1)時(shí)間(jiān)安排不(bù)合理(lǐ)
在開(kāi)始分(fēn)析工(gōn∏₽g)作(zuò)之前,一(yī)定要(yào↕↔δ)做(zuò)一(yī)個(gè)明(míng)确的(de)進度計(jì)劃,時(shε<♣í)間(jiān)分(fēn)配的(de)原則是(shì)←∏:數(shù)據收集、整理(lǐ)及建模占70%,數(shù)據可(kě)視(shì)化πφ(huà)展現(xiàn)及分(fēn)析報(bào)告占25%,♦₹₹✔其他(tā)占5%。(數(shù)據的(de)收集、整理(l≈→≠ ǐ)和(hé)建模的(de)過程,是(shì)反複叠代的(©★≠de)過程)
2)數(shù)據源選擇不(bù)合理(lǐ)
一(yī)般企業(yè)中的(de)數(shù)據來(lε★ái)源有(yǒu)很(hěn)多(duō) ÷∏ ,SAP、TMS、CRM及各部門(mén)業(yè)務系統,每個(gè)↕™•渠道(dào)的(de)數(shù)據各有(yǒu)特點。這(zhè)時(shí±↕♦),應該慎重考慮從(cóng)哪個(gè)渠道(dào)獲取數(shù)據更加快(kuàφi)捷有(yǒu)效。數(shù)據源選擇不(bù)合理(lǐ),不(bù)僅影(yǐnλ→g)響結論的(de)可(kě)靠性,而且有(yǒu)返工(gōng)的(de)風(fēn↕®g)險。
3)溝通(tōng)不(bù)充分(fēn)
無論是(shì)分(fēn)析人(rén)員(yuán)內(nèi)部↕"✘±的(de)溝通(tōng)還(hái)是(shìεα♠)與外(wài)部相(xiàng)關人(r©§φ≠én)員(yuán)的(de)溝通(tōng),都(dōu)是(sh≈↕♥ì)至關重要(yào)的(de)。與外(wài)部人(rén)員(yπ¶uán)溝通(tōng)效不(bù)順暢,可(kě)能(néng)造成前期需≥≥×求不(bù)清,中間(jiān)業(yè)務邏輯混亂,→±最終導緻數(shù)據分(fēn)析結果差強人(rén)意。與內(nèi)部人(rén)員(yuá≥ φn)溝通(tōng)效率低(dī),可(kě)能(néng)造™€ε成分(fēn)析進度滞後,分(fēn)析工(gōng)作(zuò)開(≠♣∑ kāi)展不(bù)暢等諸多(duō)問(wèn)題,直接♠≥≈ 影(yǐng)響分(fēn)析效果。
對(duì)于數(shù)據分(fēn)析師≥δ(shī),分(fēn)析經驗的(de)積累與專業(y≠πè)知(zhī)識的(de)提升同樣重要(yào),因為(wèi)有(yǒu)些(βΩ☆xiē)問(wèn)題不(bù)是(shì)隻用(yòng)專業(yè)知(zhī)識就(jiù↔×)能(néng)解決的(de),所以在平時(s€hí)的(de)工(gōng)作(zuò)中要(yào)有(yǒuα♣)意識的(de)去(qù)學習(xí)業(yè)務知(zh±™ī)識、掌握先進的(de)數(shù)據分(λ←±♥fēn)析工(gōng)具,做(zuò)一(yī)個(gè♣φ)有(yǒu)心人(rén)!