導讀:在互聯網步入大數據時代後,用戶行為給企業的產品和服務帶來了一系列的改變和重塑,其中最大的變化在於,用戶的一切行為在企業面前是可“追溯”“分析”的。企業內保存了大量的原始數據和各種業務數據,這是企業經營活動的真實記錄,如何更加有效地利用這些數據進行分析和評估,成為企業基於更大數據量背景的問題所在。
隨着大數據技術的深入研究與應用,企業的關注點日益聚焦在如何利用大數據來為精細化運營和精準營銷服務,而要做精細化運營,首先要建立本企業的用戶畫像。
01 用戶畫像是什麼
用戶畫像,即用戶信息標籤化,通過收集用戶的社會屬性、消費習慣、偏好特徵等各個維度的數據,進而對用戶或者產品特徵屬性進行刻畫,並對這些特徵進行分析、統計,挖掘潛在價值信息,從而抽象出用戶的信息全貌,如圖1所示。

▲圖1 某用戶標籤化
用戶畫像可看作企業應用大數據的根基,是定向廣告投放與個性化推薦的前置條件,為數據驅動運營奠定了基礎。由此看來,如何從海量數據中挖掘出有價值的信息越發重要。
大數據已經興起多年,其對於互聯網公司的應用來說已經如水、電、空氣對於人們的生活一樣,成為不可或缺的重要組成部分。從基礎設施建設到應用層面,主要有數據平台搭建及運維管理、數據倉庫開發、上層應用的統計分析、報表生成及可視化、用戶畫像建模、個性化推薦與精準營銷等應用方向。
很多公司在大數據基礎建設上投入很多,也做了不少報表,但業務部門覺得大數據和傳統報表沒什麼區別,也沒能體會大數據對業務有什麼幫助和價值,究其原因,其實是“數據靜止在數據倉庫,是死的”。
而用戶畫像可以幫助大數據“走出”數據倉庫,針對用戶進行個性化推薦、精準營銷、個性化服務等多樣化服務,是大數據落地應用的一個重要方向。數據應用體系的層級劃分如圖2所示。

▲圖2 數據應用體系的層級劃分
02 用戶畫像的3種標籤類型
用戶畫像建模其實就是對用戶“打標籤”,從對用戶打標籤的方式來看,一般分為3種類型:①統計類標籤;②規則類標籤;③機器學習挖掘類標籤。
下面我們介紹這3種類型的標籤的區別:
1. 統計類標籤
這類標籤是最為基礎也最為常見的標籤類型,例如,對於某個用戶來說,其性別、年齡、城市、星座、近7日活躍時長、近7日活躍天數、近7日活躍次數等字段可以從用戶註冊數據、用戶訪問、消費數據中統計得出。該類標籤構成了用戶畫像的基礎。
2. 規則類標籤
該類標籤基於用戶行為及確定的規則產生。例如,對平台上“消費活躍”用戶這一口徑的定義為“近30天交易次數≥2”。在實際開發畫像的過程中,由於運營人員對業務更為熟悉,而數據人員對數據的結構、分布、特徵更為熟悉,因此規則類標籤的規則由運營人員和數據人員共同協商確定;
3. 機器學習挖掘類標籤
該類標籤通過機器學習挖掘產生,用於對用戶的某些屬性或某些行為進行預測判斷。例如,根據一個用戶的行為習慣判斷該用戶是男性還是女性、根據一個用戶的消費習慣判斷其對某商品的偏好程度。該類標籤需要通過算法挖掘產生。
在項目工程實踐中,一般統計類和規則類的標籤即可以滿足應用需求,在開發中佔有較大比例。機器學習挖掘類標籤多用於預測場景,如判斷用戶性別、用戶購買商品偏好、用戶流失意向等。一般地,機器學習標籤開發周期較長,開發成本較高,因此其開發所佔比例較小。
03 用戶畫像8大系統模塊及解決方案
搭建一套用戶畫像方案整體來說需要考慮8個模塊的建設,如圖3所示。

▲圖3 用戶畫像主要覆蓋模塊
- 用戶畫像基礎:需要了解、明確用戶畫像是什麼,包含哪些模塊,數據倉庫架構是什麼樣子,開發流程,表結構設計,ETL設計等。這些都是框架,大方向的規劃,只有明確了方向後續才能做好項目的排期和人員投入預算。這對於評估每個開發階段重要指標和關鍵產出非常重要。
- 數據指標體系:根據業務線梳理,包括用戶屬性、用戶行為、用戶消費、風險控制等維度的指標體系。
- 標籤數據存儲:標籤相關數據可存儲在Hive、MySQL、HBase、Elasticsearch等數據庫中,不同存儲方式適用於不同的應用場景。
- 標籤數據開發:用戶畫像工程化的重點模塊,包含統計類、規則類、挖掘類、流式計算類標籤的開發,以及人群計算功能的開發,打通畫像數據和各業務系統之間的通路,提供接口服務等開發內容。
- 開發性能調優:標籤加工、人群計算等腳本上線調度後,為了縮短調度時間、保障數據的穩定性等,需要對開發的腳本進行迭代重構、調優。
- 作業流程調度:標籤加工、人群計算、同步數據到業務系統、數據監控預警等腳本開發完成後,需要調度工具把整套流程調度起來。
- 用戶畫像產品化:為了能讓用戶數據更好地服務於業務方,需要以產品化的形態應用在業務上。產品化的模塊主要包括標籤視圖、用戶標籤查詢、用戶分群、透視分析等。
- 用戶畫像應用:畫像的應用場景包括用戶特徵分析、短信、郵件、站內信、Push消息的精準推送、客服針對用戶的不同話術、針對高價值用戶的極速退貨退款等VIP服務應用。
04 一款用戶畫像產品是什麼樣的?
開發畫像後的標籤數據,如果只是“躺在”數據倉庫中,並不能發揮更大的業務價值。只有將畫像數據產品化後才能更方便業務方的使用。這裡簡要介紹用戶畫像產品化後,主要可能涵蓋到的功能模塊,以及這些功能模塊的應用場景。
畫像產品按常見的功能來看,主要包括標籤視圖與即時查詢,用戶分群,用戶人群透視分析,對用戶從事件、留存、漏斗、分布等多維度展開的深入交互式分析等模塊。下面詳細介紹畫像的產品形態。
1. 標籤視圖與查詢
標籤視圖與查詢功能主要面向業務人員使用,如圖4所示。

▲圖4
在標籤視圖版塊中,層級化地展示了目前已經上線使用的全部用戶標籤。用戶可以層級化地通過點擊標籤,查看每個標籤的詳細介紹。
在圖4中,當點擊“用戶屬性”這個一級類目,可進入到“自然性別”“購物性別”“用戶價值”等二級類目,點擊“自然性別”二級類目,可看到展開的“男性”“女性”三級標籤,進一步點擊三級標籤“男性”或是“女性”,可以進入查看該標籤的詳細介紹,如圖5所示。

▲圖5
在該標籤詳情頁中,可以查看人口屬性這一個類目下面的各個標籤覆蓋用戶量情況。
每天通過對標籤的覆蓋用戶量進行監控,可以作為預警使用。例如:某天某個標籤的覆蓋用戶量與前一天相比出現了很大比例的波動,需要排查該標籤當日ETL作業是否出現異常或是否因業務上的操作導致標籤量級的波動。

在標籤查詢模塊中,通過輸入用戶對應的userid或cookieid,可以查看該用戶的屬性信息、行為信息、風控屬性等多維度的信息,從多方位了解一個用戶的特徵。
2. 用戶人群功能
用戶人群功能主要面向業務人員使用。產品經理、運營、客服等業務人員在應用標籤時,可能不僅僅只查看某一個標籤對應的人群情況,更多地可能需要組合多個標籤來滿足其在業務上對人群的定義。
例如:組合“近30日購買次數”大於3次和“高活躍”“女性”用戶這三個標籤進行定義目標人群,查看該類人群覆蓋的用戶量,以及該部分人群的各維度特徵。下面介紹產品上的實現方式。
在“用戶人群”版塊下,點擊“新建人群”或編輯之前已添加的分組(如圖6),進入詳情頁可自定義涵蓋某些標籤的人群(如圖7)。

▲圖6 用戶自定義分群版塊

▲圖7 用戶自定義分群編輯
在自定義編輯用戶分群時,對於有統計值類型的標籤,可以自定義篩選該標籤的取值範圍,如上圖中“近30日購買次數”標籤,業務人員可篩選該標籤的數值。對於分類型標籤,如上圖中“活躍度”標籤,業務人員選中該標籤即可圈出包含該標籤的用戶。
“人群名稱”和“人群描述”表單用於業務人員描述該人群在業務上的定義,方便後續繼續查看、應用該人群。
原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/318361.html