產品設計流程的9個步驟「數據產品設計流程圖」

導讀:常規的數據產品有三種類型:用戶數據產品、商用數據產品及企業數據產品。本文將詳細介紹它們的設計思路及優秀的代表產品。在提供廣闊知識面的同時,也希望幫助產品經理們了解數據行業的全貌,知道其各自應用的場景和公司,從而能夠在職業選擇上或者為公司選擇數據產品時,更有方向性和洞察力。

優秀的數據產品是怎樣設計出來的?有哪些分類?終於有人講明白了

01 用戶數據產品

在三類數據產品中,用戶數據產品是普通用戶接觸最多也是最容易的一類,因此,我們先從用戶數據產品講起,為大家展現數據產品的獨特魅力。

根據數據來源,可將用戶數據產品細分為指數型、統計型和生活型。這三類產品的區別見表1-1。

優秀的數據產品是怎樣設計出來的?有哪些分類?終於有人講明白了

下面針對三類用戶數據產品進行具體介紹。

1. 指數型

指數型數據產品一般由企業利用自己的數據提煉出相應觀點和洞察趨勢,提供給用戶分析使用,如Google Trends、百度指數、微指數等。這些企業往往自身擁有非常龐大的用戶數據,可以據此得出整個社會群體對某個領域的關注度。

指數型數據產品的設計精髓是「比較」,通過比較各種關鍵詞在不同區域和不同時間段內的出現頻次,形成熱度的高低演化。

Google會先將某關鍵詞搜索次數除以與之相關的地域和時間段內的總搜索次數,實現數據標準化,落在0~100的區間內。同時Google會過濾掉由少數人發起的搜索請求、重複搜索和一些特殊字元,以保證指數的呈現質量。

可以看到,指數並非全面反映搜索情況的鏡子,它更多是一個抽象的描述。這和我們常見的上證指數是類似的概念,上證指數並不能反映全部市場的表現情況,但能比較概括地說明當前市場的走勢。

在百度指數里,用戶甚至能看出某個搜索詞的來源和去向,了解搜索用戶的一些興趣特徵。通過這些工具,用戶可以一窺行業走勢,對市場調研、產品分析也有一定用處。

甚至,Google在2009年曾經推出根據搜索詞預測流感的案例,識別速度比當時美國的疾控中心更加快速,一時間被引為大數據浪潮的明星例子。雖然後來預測效果有所下降,但始終不失為一個優秀的參考,幫我們了解如何用這些身邊觸手可及的數據信息更好地認知這個複雜的世界。

優秀的數據產品是怎樣設計出來的?有哪些分類?終於有人講明白了

▲圖1-1 Google Trends產品截圖

2. 統計型

統計型與指數型產品相比,最大的差別是數據均來自外部採集,然後經過企業內部整理呈現。這些產品往往可以供用戶免費試用,同時有商用版本。

  • 目前國內外的統計型產品種類多樣、方便易用,既有專註於企業融資信息及創始團隊信息的,如企查查、IT桔子、美國的CrunchBase;
  • 也有重點分析互聯網產品用戶數據及下載數據的,如分析下載量和排名數據的七麥數據(原ASO100)、國外的SimilarWeb;
  • 還有提供政治、氣候、經濟等統計分析數據的,如Tradingeconomics網站,它展示了各個國家每年的通貨膨脹率、GDP等宏觀經濟數據。

統計型數據產品的關鍵是可靠的數據源和數據清洗。一般來講,數據源都來自網路爬蟲或者統計模塊(SDK或插件)植入,前者存在一定的法律風險,且有數據容易髒亂的問題;後者獲客難度較大,好處是能拿到比較優質的數據。

3. 生活型

生活型數據產品是收集用戶自身數據並進行一定程度的歸類、分析與可視化的產品。數據對於公司來說,作用是通過統計分析來提升效率和節約成本;數據對於個人來說,則可幫助人們量化並提升自己的生活品質。

這種產品可以大致分為記賬類、運動類、天氣類、時間管理類、信息記錄類、機器信息類等。這些產品早期只是簡單記錄和統計,使用起來大多比較煩瑣,而隨著技術越來越成熟,此類產品慢慢地朝著智能化、便捷化和遊戲化三個方向發展。

數據行業早期有BI(Business Intelligence,商業智能)的說法,專為商業服務。隨著各項技術的成熟,數據產品在用戶端應該有更好的應用前景和表現,做到普惠的DI(Data Intelligence,數據智能)。有時候一個簡單的改進,就可以給用戶帶來極大的便利和價值。

當然,其中也隱含著諸多問題,比如數據安全和數據隱私。從上面的例子也可看出,只要簡單知道用戶的GPS定位,就能推斷出他的生活習慣和職業內容等。數據是把「雙刃劍」,如何做到便利性與用戶隱私之間的平衡,是個非常艱深的命題,希望業內將來可以有比較完善的解決方案。

02 商用數據產品

商用數據產品,即由企業或個人開發,提供給外部企業使用的,具備數據採集、計算、存儲、展示和分析等功能的產品。隨著社會分工日益細化,這類產品在國內外逐漸增多,從最早期的Webtrends、Omiture,到後來的Mixpanel、Amplitude,再到最近一兩年在國內名聲漸起的GrowingIO等,不一而足。

值得一提的是,國外在商用數據產品的分類上已經做得非常細緻,在數據鏈條的每個環節都有大量企業競爭,導致整個行業分布非常碎片化和廣泛。而因為國內外的企業市場成熟度等方面的差異,目前國內尚處於行業的起步階段。

1. 商用數據產品之分類

從圖1-5及圖1-6中可以看到目前商用數據產品的具體分類及領域中的相關產品。它們可分為8個類型:

  • 數據分析師平台(Data Analyst Platforms)
  • 數據科學平台(Data Science Platforms)
  • 機器學習(Machine Learning)產品
  • BI平台(BI Platforms)
  • Web/移動端/交易分析(Web/Mobile/Commerce Analytics)
  • 可視化產品(Visualization)
  • 社交分析(Social Analytics)
  • 數據源產品(Data Source,在下圖中並未標識)

分類角度可以多樣,這裡提供其中一種以供讀者參考。

優秀的數據產品是怎樣設計出來的?有哪些分類?終於有人講明白了

▲圖1-5 商用數據產品1

優秀的數據產品是怎樣設計出來的?有哪些分類?終於有人講明白了

▲圖1-6 商用數據產品2

數據分析師平台定位於數據科學家和分析師,正如Alteryx的CEO喬治·馬修對Alteryx的定位一樣:

讓分析師和數據科學家能夠在一個平台上就完成數據輸入、建模及數據圖形化,而且使用簡便,用戶界面美觀,用戶體驗比市面上的統計分析軟體都要好。數據分析師們要完成這些工作可能需要用到兩三個獨立的產品,但是用它就可以一站式全部搞定,無須其他任何軟體。

這類產品的特點是集合了數據清洗(不包括採集)到數據展示數據挖掘等近乎全鏈條流程,數據工作者可通過該類平台一站式解決所有問題。

數據科學平台則只專註於提供各種數據挖掘及演算法工具,不像數據分析師平台有專門的人群定位及整合式平台,因而靈活性更強,演算法更強大,如SAS和MathWorks。與之對比,機器學習產品更專註於機器學習領域的研究和應用。

BI平台專註於數據清洗、展示和應用環節,定位於通過商業智能的方式,使企業內各個環節提高效率和降低成本。數據來自業務資料庫、Excel等線下數據、雲服務商等第三方數據介面,不一而足。

國外最知名的產品莫過於在2019年被Google以26億美元收購的Looker公司。圖1-7介紹了Looker的工作模式,從連接數據源,到自動生成數據模型,然後改進模型以適應公司獨特的指標和商業邏輯,到最後建立基礎KPI看板和部門看板,讓用戶基本做到自給自足。

優秀的數據產品是怎樣設計出來的?有哪些分類?終於有人講明白了

▲圖1-7 Looker官網示例

Web/移動端/交易分析是互聯網從業者接觸最多的商用數據產品類型,更關注於互聯網產品本身的分析,而BI平台雖然也會部分涉及產品分析,但其服務對象一般包含企業各個部門,如提供針對財務部門或者人力資源部門的分析模塊,這是前者不會提供的內容。

國外比較知名的產品有Google Analytics和Mixpanel等,國內就是早期的百度統計、CNZZ和友盟統計(現已被阿里收購,改名為友盟+),後期的GrowingIO和神策數據等。產品形式多為端到端的分析,從數據採集、分析到展示所有環節都會囊括進去。

可視化產品就很好理解了,見名知義,這類產品都專註於數據的可視化部分。最知名的可視化產品是長期霸佔Gartner Data榜單第一名的Tableau,Tableau公司也是目前主打可視化產品的上市公司中市值最高的。它在2019年被Salesforce以157億美元收購。

從行業發展來看,BI平台和可視化產品與客戶豐富、資源強大的To B企業合作是個大趨勢,如微軟擁有Power BI,阿里巴巴有友盟+和數加,Salesforce收購Tableau,谷歌很早就推出了Google Analytics,2019年又收購了Looker。

與之對應的是,Domo作為一個曾經備受好評的公司,上市前估值曾高達20億美元,2018年6月於納斯達克流血上市,2019年12月市值僅剩下6.43億美元,算是此趨勢的一個反面例證。

社交分析產品則主要是利用市面上已有的社交產品數據進行分析並得到公關輿情、社交情緒等方面的結果。數據源產品則是利用應用商店、自有SDK或者運營商數據,進行清洗、挖掘和整合後,單獨售賣的商用數據產品,國內的Questmobile即為此類。

2. 商用數據產品之挑戰

商用數據產品作為To B市場一個很大的組成部分,在比較成熟的美國市場發展得如火如荼。近年來這種趨勢漸漸蔓延到了中國市場,在2019年伴隨著數據中台概念的大熱,商用數據產品更是如雨後春筍,比比皆是。

不同類型的商用數據產品有其特定的市場和產品特徵。我們這裡以國內常見的Web/移動端/交易分析類產品和偏產品分析的BI平台為例,來研究下商用數據產品目前面臨的挑戰和抉擇。

首先,企業市場產品不可避免地要在平台型和項目型間遊走。要想以低成本擴充用戶群體,獲得更高價值,必然得走通用型產品的路子。但企業與消費者不同,需求計劃性及業務特性較強,通用型的產品往往不能滿足其需求。

為了滿足這些大客戶,並在競爭中獲勝,企業可能慢慢滑向定製化,變成高科技外包公司。對於數據產品來講尤其如此,不同行業的公司,甚至一個行業的不同公司,對數據的需求也會千差萬別。

舉例來講,同樣是O2O的餐飲行業,美團外賣和回家吃飯關心的數據類別、分析方式有很大不同。而對於協作類、流程類產品來講,這種差異性可能沒那麼大。

其次,數據的價值體現在使用者手裡,不在數據產品身上。這點也和其他類企業產品不同。溝通類、協作類和流程類企業產品的價值體現在自身產品上,只要有人用了就有價值。

而對於數據產品來講,更重要的是企業如何根據數據作出行動。這要求企業本身具備濃厚的「用數據說話」的文化,並且能夠由上往下推動此事進展,而這不啻又一座大山。如果不能翻越這座大山,數據產品的價值就無法被客戶感知,從而導致產品黏性下降,客戶流失。

最後,因為數據的安全性和重要性,此類公司價值存在一定的天花板。在未來的時代里,數據的重要性越來越大。馬雲曾給阿里巴巴定下「五新戰略」,數據就是其中之一:新資源。公司但凡成長到一定階段,具備挖掘數據的技術能力,都會開闢一個新戰場,好好挖一挖這種新時代的「石油」。而數據安全性也必然會引起擁有用戶隱私的企業(如銀行類、航空類公司)前所未有的重視。

基於以上兩點,大公司勢必會選擇將數據緊攥在手心,成立團隊獨自開發。這就限定了此類公司的目標群體只能在中小型企業身上,成為此類型企業最明顯的邊界。在大型企業中,它們最合適的定位是作為企業數據戰略的補充者存在。

優秀的數據產品是怎樣設計出來的?有哪些分類?終於有人講明白了

3. 商用數據產品之機會

在高山地見攀登者,於遠洋處有渡航人。儘管上文列出了一些挑戰,但這個行業之所以發展旺盛,自有它的迷人之處。

機會一,數據價值的廣泛性。

相對於企業數據產品價值只局限於一個企業,商用數據產品則天然為更多的企業服務,既能對外輸出產品服務,提供商業價值,也能通過更多企業使用來發揮更大的數據價值。

數據產品就像中世紀的騎兵,培養成型後縱橫沙場、威震四方,但一般國家承擔不起,因為既無錢財人馬又無機制傳承。中小型公司因為人員和精力的問題,並沒有機制和能力管理數據,更別談專業的數據分析。

商用數據產品衝進來後填補了這塊市場空白,解決用什麼(What)和怎麼用(How)的問題,以此將數據能力賦予中小企業。這如同提供可供僱傭的騎兵隊伍,幫助他們征戰沙場取得勝利,而騎兵的價值在這個過程中也被相應地放大了。

機會二,數據需求的抽象性。

如果旨在做一個通用的分析平台,那麼如何將多樣化的數據需求抽象成一個個產品就是關鍵。甚至可以針對不同行業、不同職位的人提供對應的分析模板,以及有普適性的分析功能。

商用數據產品要求產品本身要擁有較高的行業洞察力和理解能力,並將需求進行更高一層的抽象。如果說企業數據產品的抽象是部門級或企業級的,那麼商用數據產品的抽象就屬於行業級別。

機會三,數據需求的實現程度。

可以投入大量精力開發在企業數據產品中投入產出比較小的功能,如更智能、適應性更廣的分析產品等。

對數據相關的從業人員來講,它有著另外一個魅力:數據產品也開始注重產品設計和用戶體驗。雖然這並不是此類產品成功的核心要素,不過也算是告別了企業數據產品「做出來你就得用」的時代,需要考慮數據如何以更便捷、更友好的方式展現給用戶。

隨著中國市場人口紅利的消失及勞動力價格的上升,專註於提高企業效率的To B產品漸漸受到投資行業和眾多公司的關注。商用數據產品作為其中一員,亦將在這波浪潮中受益。

如上文所提,此行業內挑戰與機會並存,對比已經發展成熟的美國市場,中國在優秀的企業服務公司上還是一片空白。期待中國商用數據產品市場迎來豐收的一天。

優秀的數據產品是怎樣設計出來的?有哪些分類?終於有人講明白了

03 企業數據產品

1. 什麼是企業數據產品

企業數據產品,由企業自建自用,主要目的是降低員工使用數據的門檻,輔助人員作出決策和提高業務效率。根據內部定位,企業數據產品可再細分為應用型平台型

應用型的企業數據產品專註於解決某個具體的業務問題或者部門問題,如客服數據監控系統和建立在集團平台的事業部決策分析系統;而平台型的目的就是為前者提供更好的支撐。

1)企業數據產品之數據

數據界定了產品的性質和邊界。企業數據產品關注核心在於降低數據使用門檻,利用數據優化業務,從而提高數據資產價值。因此,我們既需要關注數據在企業員工中的使用情況,改進體驗不流暢的部分,也需要關注業務需求,為業務效率服務,最後還需要從數據資產本身出發,思考如何最大化發揮它的價值。

我們來看下轉轉公司利用企業數據產品提高業務效率的例子。企業內負責數據的部門往往會遇到很多提數需求。此類需求在數據部門看來價值不大,在業務部門看來需求緊迫但流程漫長,效率低下。一個需求提到數據部門後,要先經過需求評審,然後開發排期,最後到校驗產出等若干個環節,業務部門可能會因此錯過關鍵的運營時間點。

基於此,轉轉數據中台設計了一個代號為「天樞」的數據產品,將針對用戶UserID、Token、訂單、商品等分析對象的常見屬性和篩選條件組合起來,並橫向整合了大數據、搜索、推薦、風控等部門的標籤結果。

同樣的需求,業務方只需要在「天樞」上點點選選,就能完成數據提取和分析,原來需要耗時1~3天的工作,在「天樞」里幾分鐘內就能完成。

「天樞」上線9個月,用戶就自主完成超過13 000個分析任務,效率提升顯著。在這個例子中,轉轉通過降低業務方使用數據的門檻,間接提高了他們的運營效率,同時使沉澱於企業內各部門的數據資產得到了更好的發揮和利用。

這裡有一個小小的提醒是,數據產品不產生數據,只是數據的搬運工,要和非常底層的業務邏輯保持適當距離。對於日誌列印、業務庫設計等這些數據「原材料」,我們可以根據經驗提出更優的方案,但不適合進行具體的落地和執行。

很多數據產品經理在一些業務需求的實現過程中覺得比較低效和彆扭,部分原因就是參與業務需求太深,導致在數據聚合層次摻雜了太多業務邏輯,不能實現數據層和業務層的有效隔離。

優秀的數據產品是怎樣設計出來的?有哪些分類?終於有人講明白了

2)企業數據產品之企業

面向企業內部的定位決定了此類需求具有受眾集中、反饋迴路短、用戶體驗要求低、需求繁雜瑣碎、層級明顯、看重數據安全6個特徵。這些特徵對數據產品經理來講,有利有弊。

受眾集中很好理解,本身就是面向企業內部的數據產品,相對於To B和To C類型的產品來講自然用戶比較集中。這裡的集中有兩個概念,一個是地理意義上的集中,一個是業務認知和群體素質的集中。使用者和設計者的溝通在這兩個集中概念下變得相對高效。這也決定了後面兩個特徵:反饋迴路短和用戶體驗要求低。

反饋迴路短有需求反饋和價值反饋兩個方面。用戶數據產品和商用數據產品面向的都是外部的使用群體,其到數據產品經理的反饋迴路較長,大部分需要用戶調研、上門拜訪、產品使用分析等比較間接的手段。而在企業內部,可能就是業務方走到你工位旁直接告訴你。

這樣的好處在於,能夠更直接地了解業務方的需求和產品落地的價值,便於隨時對產品進行調整;壞處在於很多時候短迴路無法提供一個緩衝期,有很多臨時變卦的可能性。因此我們需要揚長避短,把控好短回饋的節奏。

與用戶數據產品和商用數據產品性質相同的是,企業數據產品也對用戶體驗要求較低。一方面因為受眾集中,一些操作起來比較麻煩的產品,可以通過舉辦定期的培訓和講解來解決;另一方面,不存在類似To B和To C產品有競爭的問題,因此體驗問題顯得不那麼重要。

當然,即使優先順序低,產品依舊需要著力降低數據的使用門檻,比如數據提取、指標分析、結果分享等過程。如果不重視數據方面的使用體驗,比如業務方需要費很大勁才能弄清楚兩個指標間的差別,甚至錯誤地使用指標,那麼對於數據部門的聲譽和數據價值都是很大的傷害。

需求繁雜瑣碎,但其核心是需求控制和分級問題。各公司數據部門的定位不同,可能會有差異,但大部分情況下,基本所有數據相關的需求都會落在該部門頭上,有些是臨時探索,有些是長期分析。

如果不先進行分門別類再進行排序篩選,數據產品就可能陷入數據泥沼里,脫不開身。需求的控制和分類,我們會在下面講搭建企業數據平台型產品時介紹。

企業內用戶層級明顯,越到高層越能體現數據的價值。我們經常開玩笑說,老闆的需求是最重要的。從數據這一方面來看,未必有錯。因為「數據價值取決於數據使用者」,高層們看待數據的方式以及據此作出的決策,影響面往往更大,效果更明顯。有層級的不僅是用戶,更是數據發揮的價值。

最後,市場競爭激烈,數據安全及許可權也是頭等大事。但凡是企業內的數據中台,都躲不開許可權設置的問題。常見的許可權模型為RBAC(Role-Based Access Control,基於角色的訪問控制)。它抽象出用戶、角色、許可權三個概念,通過角色控制菜單許可權,再為用戶賦予相應角色。角色一般根據業務部門和領導層級綜合劃定。

這裡需要多提一句的是,數據許可權與安全和降低數據使用門檻是不衝突的,合適的劃分是關鍵所在。同時,要盡量簡化許可權申請和審批流程,提高業務部門的使用效率。

3)企業數據產品之產品

這裡企業數據產品分為應用型平台型兩種。

應用型的核心是業務敏感度,根據不同的業務需求設計對應的數據產品,如根據風控部門的需求來實時更新對應的風控標籤和數據閾值,並且提供對應的監控和分析工具,完成從策略應用到分析落地的閉環。

平台型強調的是面向各個業務提供服務,這要求產品具備較高的標準化抽象化水平。標準化指的是主動出擊,定下一些關鍵的數據資產規範,方便在企業中流通使用,如埋點管理、指標管理和資料庫表管理等。抽象化指的是不能只關注於解決一兩個具體的需求點,而是關注整個面的抽象和滿足,是一個由點及面的過程。

2. 企業數據產品之平台型

1)企業數據平台的目標

借用GrowingIO CEO Simon的理念,企業如同人類建立的水資源使用系統,而數據如水。企業數據平台的建設目標,應當是讓數據像水資源一樣在企業中流動,如圖1-8展示的水循環系統一般。這意味著數據要像水一樣做到乾淨無害、隨用隨取、場景豐富,而這恰好對應著數據準確、及時、易用、全面四個衡量維度。

優秀的數據產品是怎樣設計出來的?有哪些分類?終於有人講明白了

▲圖1-8 數據像水資源一樣流動

進入人類資源使用系統的水資源需要經過一定的清洗和沉澱,確保「乾淨無害」,然後根據不同的水用途存儲,進入不同的管道,這對應著數據的「準確」。

而這裡的「隨用隨取」指在人類社會中,擰開水龍頭就能出水,對應著數據的「及時」與「易用」。

「場景豐富」則意味著在不同場景里,水會有不同用途,飲用水、清潔用水、灌溉用水各取所需,單單飲用水就又分城市用水、礦泉水、純凈水等不同使用方式,這對應著通過挖掘和豐富數據的使用場景,深化數據本身「全面」的含義。

達成這個目標的企業數據平台,便能通過豐富場景、賦能業務來提升整個企業使用數據的意願和效率,賦予業務方高效使用和挖掘數據的能力。企業數據平台的主要使用場景如下:輔助企業決策(如市場動向、用戶分析和財務分析等)、建立數據流程、優化用戶體驗、挖掘數據資產等。

建立數據流程,從產品上,是幫助業務方更好地完成使用數據的流程,包括採集存儲、展示分析到最後的挖掘落地三個層次;從需求上,即建立一個比較完善的需求分流解決機制,將零散需求、常規需求、業務需求等分類處理完畢,並能將進展和結果及時反饋給需求方。

優化用戶體驗是通過掌握用戶數據為用戶提供更加順暢的使用體驗、更加精準的營銷等。挖掘數據資產包括標準化數據資產,以及不斷挖掘回饋原有數據,豐富已有數據維度。

2)如何搭建企業數據平台

一個完善的企業數據平台應該由技術框架、數據框架和產品框架三部分組成,如圖1-9所示。

優秀的數據產品是怎樣設計出來的?有哪些分類?終於有人講明白了

▲圖1-9 企業數據平台之產品框架

技術框架本文暫不介紹。數據框架主要有數據模型、安全及質量這三個模塊。其中,數據模型負責根據業務抽象出對應的領域模型,如電商、社交、遊戲等,然後確定對應的主題域劃分和維度模型。

產品框架上,遵循What-Why-How的劃分方式。

  • 首先解決採集存儲,即「是什麼」(What)的問題,將數據採集後清洗存儲下來;
  • 其次解決「為什麼」(Why)的問題,利用分析架構和數據可視化展示,幫助用戶尋找原因;
  • 最後解決「怎麼做」(How)的問題,通過價值的深入挖掘、與業務緊密結合等方式,來確定具體的內容和方向。

對於具體的需求,我們根據其層次不同,通過三種遞進的方案來滿足。

自定義分析。基本不需要數據和分析部門介入,提供工具就能滿足業務需求。面對這種需求,基本有三個解決方案:

  • 一是採用開源方案HUE搭建的SQL查詢功能,解決非常零碎且無法產品化的臨時需求;
  • 二是基於埋點的自動分析功能,只要按照數據規範進行的埋點,都可以在頁面查詢並分析數據;
  • 三是採用自定義報表分析界面,支持業務方導入數據表後進行可視化展示。

這三種方案解決三種不同層次的需求,可以幫助節省大量人力。

事件分析。需要數據部門進行一定程度的抽象,常見的就是留存/漏斗分析。這類需求的典型特徵是尋求事件之間的留存轉化規律,抽象後可以落地成對應的數據工具。這些工具有一定的培訓成本,適用特定場景。

多維交叉分析。需要數據部門根據業務進行規劃和設計對應的分析體系,包含合理的維度和指標。一般來說,這會是一個部門的基準需求,使用頻次高,用於每天監控及分析業務異常原因。

3. 企業數據產品之應用型

我們以智能分析中的一個場景為例。背景是當某一時刻發生數據異常時,業務方希望能夠第一時間發現這個異常,並定位背後的原因,進而提高決策效率。目前市面上的常見方案是先通過時間序列預測演算法(Hot-Winters)根據過往歷史數據,產出對下一時刻數據的預測值,然後與現實值對比,如圖1-10所示。

優秀的數據產品是怎樣設計出來的?有哪些分類?終於有人講明白了

▲圖1-10 企業數據應用之智能分析

一般來講,這種差值會形成一個類正態分布,當差值落在兩個標準差之外的範圍時,我們就認為當前數據異常,觸發報警。同時,我們根據異常維度分析演算法(常見的有基尼係數和決策樹等),將該異常進行維度和組合拆解,定位原因所在。這樣一來,整個異常的發現和分析過程就變得十分高效。

綜上,企業數據產品在設計和開發上有很多獨有的特點

  • 首先,企業數據產品承接了來源眾多的業務需求,在抽象和管理上難度較大,很容易產生冗餘浪費,歷史依賴混雜不清,整個BI平台變成數據的垃圾場、泥沼地。
  • 其次,數據開發工作長期來看是個細活、臟活、累活,要想長期保證數據安全、質量和規範,需要設計各種機制進行監測,並不斷優化。
  • 最後,在發揮企業數據資產價值的路上,我們還需要不斷豐富場景,設計與開發符合業務場景的數據產品。

儘管如此,作為企業管理和挖掘數據資產的抓手,企業數據產品在未來企業競爭中依然顯得無比重要。

原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/323193.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
投稿專員的頭像投稿專員
上一篇 2025-01-12 12:45
下一篇 2025-01-12 12:45

相關推薦

發表回復

登錄後才能評論