用戶畫像知識大全「用戶畫像分群基本屬性」

用戶畫像,即用戶信息標籤化,是大數據精細化運營和精準營銷服務的基礎。在大數據的時代下,用戶的一切行為是可追溯和分析的。用戶畫像是通過分析用戶的基礎信息、特徵偏好、社會屬性等各維度的數據,刻畫出用戶的信息全貌,從中挖掘用戶價值。它可以幫助數據「起死回生」,提供個性化推薦、精準營銷、個性化服務。

用戶畫像1:用戶畫像基礎

一、畫像基礎

1.1 標籤類型

用戶畫像建模其實就是對用戶「打標籤」,一般分為三類:

● 統計類標籤:最基礎常見的標籤,從用戶註冊數據、用戶訪問數據中統計得出。

● 規則類標籤:基於用戶行為及規則產生,通常由對業務更為熟悉的運營人員和數據人員共同協商確定。

● 機器學習挖掘類標籤:通過機器學習挖掘產生,根據某些用戶行為或熟悉進行預測判斷。例如,根據一個用戶購買化妝品護膚品的次數權重更高,得出該用戶的性別是女性。

用戶畫像1:用戶畫像基礎

1.2 數據結構

畫像系統的基礎設施包括Spark、Hive、HBase、Airflow、Redis、Elasticsearch。下圖是《用戶畫像》中的數據倉庫架構。

用戶畫像1:用戶畫像基礎

① 數據倉庫ETL加工流程是對每日的業務數據、日誌數據、埋點數據等數據經過ETL過程,加工到對應的原始數據層(ODS)、數據倉庫(DW)、數據集市層(DM)中。

② 用戶畫像不是產生數據的源頭,是經過ODS層、DW層、DM層中的數據與用戶相關數據的二次建模加工得到的數據。在ETL過程將用戶標籤寫入Hive,根據不同數據對應不同數據庫的應用場景,再將數據同步到MySQL、HBase、Elasticsearch等數據庫中。

Hive:存儲用戶標籤、用戶人群及用戶特徵庫的計算結果

MySQL:存儲標籤元數據,監控相關數據,導出到業務系統的數據

HBase:存儲線上實時數據

Elasticsearch:支持海量數據的實時查詢分析

③ 用戶標籤在Hive中加工完成後,部分標籤通過Sqoop同步到MySQL數據庫,提供用於BI報表展示的數據、多為透視分析數據、圈人服務數據;另一部分標籤同步到HBase數據庫用於產品的線上個性化推薦。

1.3 用戶畫像模塊

搭建用戶畫像方案整體考慮以下8個模塊

用戶畫像1:用戶畫像基礎

用戶畫像主要覆蓋模塊

● 用戶畫像基礎

了解和明確用戶畫像包含的模塊,設計數據倉庫架構、開發流程、表結構,及ETL的設計。主要就是明確大方向的規劃。

● 數據指標體系

建立數據指標體系,根據業務線梳理,包括用戶屬性、用戶行為、用戶消費、風險控制等維度的指標體系。

● 標籤數據存儲

設計好數據指標體系後,考慮不同應用場景使用哪種存儲方式。

● 標籤數據開發

重點模塊。標籤數據開發包含統計類、規則雷、挖掘類、流式計算類標籤的開發,以及人群計算功能的開發。

重點內容:數據調研、和業務方確認數據口徑、標籤開發上線。打通畫像數據和各業務系統之間的路,提供接口服務

● 開發性能調優

標籤數據開發上線後,為了縮短調度時間、保證數據穩定性,需要對標籤腳本、調度腳本進行迭代重構、調優。梳理現有標籤開發、調度、校驗告警、同步到服務層等相關腳本、明確可以優化的地方,迭代優化。

重點內容:減少ETL調度時間,降低調度時的資源消耗。

● 作業流程調度

標籤加工、人群計算、同步數據和業務系統、數據監控預警腳本開發完成後,需要調度工具把整套流程調度起來。

重點內容:滿足定式調度、監控預警、失敗重試,各調度任務之家的複雜依賴關係。

● 用戶畫像產品化

產品化的模塊包括包括標籤視圖、用戶標籤查詢、用戶分群、透視分析等。

重點內容:滿足業務方對用戶精準營銷的需求。

● 用戶畫像應用

應用場景包括用戶特徵分析、短訊郵件、站內信、Push消息的精準推送,客戶針對不同用戶的話術、針對高價值用戶的極速退款等高級服務應用等。

重點內容:幫助業務方理解和應用用戶畫像數據,提高用戶活躍度和GMV。

1.4 開發上線流程

用戶畫像1:用戶畫像基礎

原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/323322.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
投稿專員的頭像投稿專員
上一篇 2025-01-12 12:46
下一篇 2025-01-12 12:46

相關推薦

發表回復

登錄後才能評論