必備的8個主要流程「數據分析的流程包括哪些」

1. 新的需求

數據分析工作流程的第 1 個狀態,就是忠實地記錄新的需求,純粹地站在需求方的角度,不加任何評判地收集原始的需求。

這個狀態借鑒了 ORID 焦點討論法的第 1 步,也就是真實地記錄客觀的事實。

關於 ORID 焦點討論法,我從網上查了一些相關資料,看到下面這個例子,感覺比較恰當。假設昨天晚上在下班的路上,我遇到一條狗(O 事實),當時我很害怕(R 感受),心想應該怎麼辦(I 思考),為了避免被狗咬,我最終決定繞路走(D 決定)。

數據分析的 8 個工作流程

2. 需求確認

需求確認是分析任務成敗的關鍵,針對不同的情況,應該採取不同的對策。

第 1 種情況:需求方無法清楚描述問題。

劉思喆老師說,這類需求方的專業技能不合格,會禍害上下游,「fire」掉就可以了,絕對不可以手軟。

關於「fire」這個英文單詞,有「開除」的意思,不過我理解劉思喆老師在這裡表達的應該是「拒絕」。

對於一般的數據分析師而言,需求方可能就是自己的老闆,恐怕沒有「開除」的勇氣。遇到這種情況,我個人建議加強溝通交流,主動多問一問具體情況,搞清楚需求方的真正意圖。

第 2 種情況:需求方將很多問題混雜在一起。

這種情況非常普遍,數據分析師需要應用 MECE 原則,幫助需求方梳理業務,變成相互獨立、完全窮盡的問題,並了解其中的主要矛盾和次要矛盾。

第 3 種情況:需求方無法和數據進行映射。

這種情況也相對比較普遍,一般企業是通過「角色前置」來緩解這個問題,比如設置「產品經理」的崗位角色。不過有的時候,前置的角色可能不合格,這就需要數據分析師在「數據確認」環節給予專業的建議。

第 4 種情況:需求方提出了錯誤的數據需求。

想象一下,數據需求本身就不對,你作為數據分析師,居然漂亮地執行完成了……結果需求方不滿意,又提了一遍,後面可能還有第三遍……最終需求方可能很不滿意,數據分析師吃啞巴虧。

當出現這種情況時,建議數據分析師在執行之前,先進行合理的溝通,指出數據需求本身的不當之處。

第 5 種情況:需求方無法預判可能的分析結果。

這種情況很正常,畢竟很難碰到非常完美的需求方。我認為此時數據分析師應該多一些包容和理解,多站在對方的角度看問題,自己先學會預判,然後再幫助對方學會預判,為對方排憂解難。

假如遇到需求方不僅掌握業務和數據之間的關係,而且懂得利用數據分析的結果,來指導下一步的行動,那麼數據分析師應該好好珍惜。

3. 數據確認

當需求確認清楚之後,接下來需要確認數據源,可能會遇到 3 個問題。

第 1 個問題:期望的數據沒有存儲。

作為數據分析師,如果你能幫助改善這個問題,讓企業的數據更加完備,那麼你的影響力將會得到提升。

第 2 個問題:數據分散在不同的位置。

在傳統企業,這個問題非常普遍,可能還沒有建立數據倉庫。對於互聯網企業,這個問題體現了數據倉庫設計的不完備。

如果不是經常性的問題,臨時解決即可。如果是經常性的問題,建議數據分析師主動了解底層的數據邏輯,編寫自動化的代碼,在可能的情況下,交付給數據倉庫團隊。

第 3 個問題:數據源錯誤。

這個問題非常致命,如果數據源不對,後面的分析結果可能造成誤導,讓需求方做出錯誤決策,後果不堪設想。

所以,數據分析師提高數據敏感度也很重要,在做數據分析之前,一定要先確認一下,數據源是正確無誤的嗎?

4. 實現中

在需求實現的過程中,數據分析師要管理好自己的分析代碼。

以 Python 為例,盡量使用 Numpy、Pandas、Matplotlib 等比較成熟的包,用 Git 做好代碼的版本控制,特別注意代碼注釋和提交信息的可讀性和完整性,讓數據處理的每個步驟都清晰易懂。

另外,配合使用 Jupyter Lab 之類的工具,能大大提升數據分析的工作效率。

一方面,我們要把好的經驗和方法,沉澱為固定的流程步驟,實現工作的流程化。比如一個數據報表,用怎樣的格式和規範,讀者容易抓住其中最有價值的信息?

另一方面,我們還要實現流程的工具化。因為總有人會「偷懶」,總有人會逾越流程,總有人會偷偷地繞過流程。所以,我們要適應用工具來輔助流程的執行。

如果流程工具用起來不適應,怎麼辦?

華為早年引入集成產品開發 (簡稱 IPD)的流程,大家剛開始也不適應。

任正非說了一句話:先僵化、後優化、再固化。

5. 交付

突出主要分析結論,這是數據分析交付的重要內容。

如果分析沒有結論,就不能稱之為交付。

交付的內容,包括文字、表格、圖形等要素。文字表述要條理清晰,表格製作要標準規範,數據可視化的圖形要選擇合理。

數據分析的 8 個工作流程

6. 復盤

很多數據分析工作,最終停留在「交付」這個狀態,數據分析師交付結果之後,往往沒有去跟進後續的效果情況,沒有對分析的價值進行判斷,沒有進行復盤總結。

交付之後,不妨思考一下,我們通過數據分析,幫助需求方做出了哪些正確的決策?給企業帶來了哪些價值?與當初預期的目標相差多少?關鍵因素有哪些?假如重新再做一遍,怎麼做才能做得更好?

在復盤總結的過程中,可以鍛煉數據分析師對業務的理解能力和對價值的預判能力。

7. 等待

當你發現目前還不具備分析的條件時,那麼可以選擇等待一下。

比如說,當需求還沒有確認清楚的時候,應該等待需求方有空的時候,把需求溝通確認清楚。當缺少必要的數據源時,因為巧婦難為無米之炊,所以也需要耐心等待。

當然,在等待的時候,可以先思考一下大致的分析方向,以便讓後面的實現過程更加快捷。

8. 拒絕

當需求肯定無法實現的時候,要明確地予以拒絕,不要給人模稜兩可的答覆,此時要避免讓需求方有很大的期待,結果因實現不了而導致失望。

小結

本文總結了數據分析工作流程的 8 個狀態,

為了避免被貼上被動、低價值、重複勞動的標籤,數據分析師要主動完善自己的工作流程,優化自己的工作狀態。

最後,我把數據分析的 8 個狀態之間的流轉,用一張流程圖串聯了起來。

數據分析的 8 個工作流程

以上,希望能夠對你有所啟發。

原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/323518.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
投稿專員的頭像投稿專員
上一篇 2025-01-12 12:47
下一篇 2025-01-12 12:47

相關推薦

發表回復

登錄後才能評論