2 標籤體系概覽
2.1 什麼是對象

2.2 什麼是標籤
標籤是人為設定的、根據業務場景需求,對目標對象運用一定的算法得到的高度精鍊的特徵標識。
標籤是對對象某個維度特徵的描述與刻畫,是某一種用戶特徵的符號表示,每一種標籤都規定了我們觀察認識描述對象的一個角度,用於對象的標註、刻畫、分類和特徵提取。
現實世界中標籤還有三種表現形態:實物標籤、網絡標籤和電子標籤。
- 實物標籤(Label)是用於標明物品的品名、重量、體積、用途等信息的簡要標牌,例如:商品標籤、價格標籤、車檢標籤、服裝吊牌、車票、登機牌都是實物標籤;
- 網絡標籤(Tag)是一種互聯網內容組織方式,是相關性很強的關鍵字,它能幫助人們通過關鍵詞快速建立對內容總體印象;
- 電子標籤又稱RFID射頻標籤(Label),是一種識別效率和準確度都比較高的識別工具,通過射頻信號自動識別目標對象並獲取相關數據,識別工作無須人工干預,可工作於各種惡劣環境。
用戶畫像里的標籤,實際上屬於網絡標籤(Tag)。
2.3 什麼是標籤體系
所謂標籤體系,就是對企業需要的多種標籤進行歸類、同時對標籤屬性加以定義,從而更方便的對標籤進行管理維護。標籤體系包含兩部分(標籤分類體系即標籤類目+標籤內容信息),最好能通過標籤系統來維護。也可按描述對象分類。

2.4 用戶標籤體系
標籤類目,分類方式很多,建議採用按業務場景的分類方式。
以下是電商場景的標籤類目(最底層分類我只是象徵性寫了幾個能說明問題就好)。個人覺得阿里達摩盤的分類更好些,因為趙宏田老師的分類違背了不丟不重的基本分類原則:


標籤內容信息,也叫標籤屬性,是從多個不同角度對標籤進行描述。

2.5 商品標籤體系
按照應用場景區分,商品標籤分為基礎屬性、交互行為、適配場景、供應鏈屬性、商品價值等。

2.6 什麼是用戶畫像
用戶畫像,即用戶信息標籤化,通過收集用戶的社會屬性、消費習慣、偏好特徵等各個維度的數據,進而對用戶或者產品特徵屬性進行刻畫,並對這些特徵進行分析、統計,挖掘潛在價值信息,從而抽象出用戶的信息全貌。
用戶畫像可看作企業應用大數據的根基,是定向廣告投放與個性化推薦的前置條件,為數據驅動運營奠定了基礎。由此看來,如何從海量數據中挖掘出有價值的信息越發重要。
上邊這段話是趙宏田老師書里寫的。我覺得,用戶畫像就是在用戶標籤的基礎上進行組合提煉,來刻畫描述用戶群體,以便更清晰的了解用戶,從而投其所好。畢竟用戶才是金主爸爸。
2.7 標籤體系的應用場景
DMP、CDP
- CRM應該聽的比較多,就是客戶關係管理系統(Customer Relationship Management)。
- DMP就比較少的人聽說了,是數據管理系統(Data Management Platform),對應的前台應用叫DSP,廣告精準投放平台(Demand-Side Platform )。
- CDP最近倒是挺火的,是客戶數據平台(customer data platform)。
以下是摘要,想看更多的,文末有分享鏈接。
- CRM,它應該是企業的核心客戶的系統,是以交易ID或者Leads ID定義數據的系統,存放的主要是“井水不犯河水”時代的那些客戶的靜態數據。
- DMP,它應該是以廣告投放管理,尤其是程序化廣告投放管理為核心目的的受眾數據系統。
- CDP,它應該是支持流量運營、用戶運營、客戶運營、潛在客戶運營的人群細分的數據系統。
DMP的核心思想,是記錄每一個個體消費者在不同營銷觸點上的“交互痕迹”,基於這些痕迹,區分不同消費者的特徵,並對不同特徵的消費者群體提供針對性營銷策略或是輸出這些人群作為細分受眾給其他營銷執行機構。
因此,它具有幾個核心特徵:
1. 它能夠收集不同營銷觸點上的數據,如果有遇到不能收集的營銷觸點的情況,也應該能夠整合別人收集的數據;
2. 它能夠通過這些數據,建立不同的消費者的特徵,即建立消費者特徵屬性的標籤;
3. 它能夠依據不同的消費者屬性標籤及消費者觸點上的數據,將具有同樣特徵或數據的消費者篩選出來,並組合成特定受眾人群;
4. 它能夠分析特定人群的觸點數據和屬性數據,並進而判斷已經執行的營銷決策是否合理,或是為即將執行的營銷提供策略支持;
5. 它能夠將它生成的特定細分人群及相關數據輸出給營銷執行機構實現相關人群觸達或投放。
上面的是標準意義上的DMP的意思。圍繞人的數據,收集數據 – 整合數據 – 打標籤 – 人群細分為群主 – 輸出為策略/輸出為人群包 – 投放支持。
DMP的數據源可以是第一方自己的數據、也可以是合作企業的數據、也可以是購買的公開數據源或者數據市場裡面的數據。
推薦系統
一個推薦系統效果好與壞最基本的保障、最基礎的是什麼?如果讓我來回答,一定是標籤體系。我這裡說的標籤主要是針對物料的,對於電商平台來說就是商品;對於音樂平台來說就是每一個首歌,對於新聞資訊平台來說就是每一條新聞。下一篇要介紹的是用戶畫像,畫像中那些用戶實時變化的興趣點大都也是來自於標籤體系,依據用戶長期和短期行為中對於物料搜索、點擊、收藏、評論、轉發等事件,將物料的標籤傳導到用戶畫像上,就構成了用戶的實時畫像和離線畫像中的各個動態維度。
用戶畫像系統
所謂的用戶畫像系統,顧名思義,就是對用戶進行一些畫像……這句話好像啥信息量也沒有。但說白了,其實就是對用戶的特徵進行提煉、進行復原。
功能上,其實主要分為兩大系統,一部分是標籤系統,一部分畫像系統。用戶標籤是整個系統的數據基礎,是鏈接標籤系統和畫像系統的橋樑。除此之外,也包括一些人群管理等外圍系統功能。
所謂標籤系統,就是利用企業自由數據、第三方數據、採購數據等等,對自有的用戶進行打標籤的處理。標籤系統既可以自主生成標籤,也可以對標籤進行有序管理維護。
所謂畫像系統,就是利用標籤,進行的可視化分析及各類應用的落地。簡單的,可以是一些統計分析;複雜的,可以是人群的各維度的透視。
數據中台
在眾多的數據中台的解決方案中,一個叫做“標籤中心”或“標籤體系”的應用,幾乎成了數據中台的“標配”。
數據中台是數據+技術+產品+組織的有機組合,是快、准、全、統、通的智能大數據體系。與數據倉庫等傳統數據工具相比,數據中台是一種新的理念,以“技術+業務”為雙驅動,是企業開展新型運營的一個中樞系統。
因此,如果你將數據中台定位成一個存數據、管數據的技術平台,那或許有“分類體系”就可以了。如果你的數據中台定位的是企業數字化轉型的運營中樞系統,要實現對前端業務的支持和賦能,那“標籤體系”就是數據中台一個標配。原因前邊介紹過,分類是自上而下的規劃,側重標準化,標籤是自下而上的倒推,注重業務場景。
“數字轉型,場景為王”,在“技術+業務”雙驅模式的數據中台中,標籤體系、數據萃取將助力企業運營轉型升級。
3 標籤體系建設方法及質量評估標準
3.1 標籤體系構建流程

標籤體系構建原則
原則一:
因此最佳的處理方式是,我們應該放棄頂層的用戶抽象視角,針對各業務線或部門的訴求和實際的應用場景,分別將標籤聚類起來提供給相應部門。
原則二:
標籤生成的自助化能夠讓溝通成本降最低
標籤生成的自助化,可重複修改的規則,降低無效標籤的堆積
釋放數據團隊人力,釋放業務團隊的想象力
原則三:
規則及元信息維護
調度機制及信息同步
高效統一的輸出接口
我們回顧標籤體系構建的三原則,本質上是解決了價值、手段、可持續性三方面的問題:以業務場景倒推需求,讓業務方用起來作為最終目標,讓標籤系統價值得以實現;標籤生成的自助化,它解決的是我們用什麼樣的手段去實現價值;有效的標籤管理機制,意味着一套標籤體系能否可持續性地在一家企業裡面運作下去。
總之,對企業最重要的是:一套標籤系統在業務上用起來,能不能覆蓋更廣泛的需求,而不是一個大而全的框架。
標籤體系實施架構
標籤體系架構可以分為三個部分:數據加工層,數據服務層,數據應用層。每個層面面向用戶對象不一樣,處理事務有所不同。層級越往下,與業務的耦合度就越小。層級越往上,業務關聯性就越強。

標籤體系整體設計-業務梳理
以業務需求為導向,可以按下面的思路來梳理標籤體系:
- 有哪些產品線?產品線有哪些來源渠道?一一列出
- 每個產品線有哪些業務對象?比如用戶,商品
- 最後再根據對象聚合業務,每個對象涉及哪些業務?每個業務下哪些業務數據和用戶行為?

標籤體系整體設計-標籤分類
按業務需求梳理了業務數據後,可以繼續按照業務產出對象的屬性來進行分類,主要目的:
- 方便管理標籤,便於維護和擴展
- 結構清晰,展示標籤之間的關聯關係
- 為標籤建模提供子集。方便獨立計算某個標籤下的屬性偏好或者權重
梳理標籤分類時,儘可能按照MECE原則,相互獨立,完全窮盡。
標籤層級控制在三到四個為宜。
一級標籤控制中 10 個以內,太多不易於使用。
3.2 標籤體系質量評估標準
為什麼要進行標籤質量評估
想象一下,我們開發了一個“用戶年齡”標籤,業務想針對20-30歲的人進行精準投放。但經過篩選,才篩出來幾千個人,和公司總體用戶相比僅僅是九牛一毛,那這樣的標籤,還有價值不?
因此,對標籤的質量進行科學完整地評估,有助於指導標籤的管理者、開發者不斷地提升標籤質量。通過創建一套完整的評估體系,對於質量過差的標籤,不着急上線,等達到基本的質量要求後再開放給業務使用。不然,既對業務帶來不了價值,也容易讓標籤畫像系統失去用戶的信任。
回過頭來,上面這個例子反映的問題,其實就是標籤的質量差。準確地說,是標籤的覆蓋度太低了。除了覆蓋度,還有很多指標可以衡量一個標籤的質量,咱們在下面詳細展開,主要通過 數據質量、應用質量、業務質量 三個方面來評價標籤的質量。
數據質量評估是標籤質量最基礎的評價,主要分為準確度、覆蓋度、穩定性 三部分。
標籤覆蓋度的含義,是指在一個標籤中,有業務含義的人群數量與總人群數量的比例。
標籤的穩定性也是影響標籤質量的重要因素。
什麼是穩定性呢?舉個用戶年齡標籤的例子。昨天30歲以下的用戶有200萬,佔比10%,今天就成了1000萬,佔比50%。這種標籤數據,你敢用么?是數據的計算邏輯出現問題,還是其他原因導致?
因此在標籤的質量評估中,標籤值的相對穩定性,是重要的評估標準之一。
應用質量評估是從產品角度出發,評估標籤對於產品應用的價值。
若一個標籤的數據質量高,但是用戶都用不起來,不好用,那麼也是難以發揮出標籤內在的價值。
關於應用價值的衡量,往往會用一些滯後性的指標衡量。基礎假設是,業務人員用的多的標籤,一定是應用質量好的;業務人員用得少的標籤,一定是應用質量弱的。
具體衡量應用多少的指標,可以用【使用次數】、【使用熱度】、【調用次數】等來綜合衡量。
對於應用價值低的標籤,可以針對性地進行分析,不斷提升每個標籤的應用價值。
業務質量評估是最不好衡量的,但又是最最重要的。因為相比於數據質量是從數據層出發、應用質量是從產品層出發,業務質量是從業務層出發,是離業務價值最近的。
想象一下,業務如果用了一個標籤,對一群人進行了投放,ROI是日常投放的好幾倍,那這個標籤的價值可以說是毋庸置疑了。這時,我們可以說這個標籤的業務質量很高。
什麼樣的標籤的業務質量會比較高呢?比如:【用戶購買偏好】、【用戶的營銷敏感度】等等。這類的標籤往往都是一些複雜邏輯的算法標籤,常常有比較強的業務質量。
但這裡存在的一個悖論,就是業務質量是後驗的。即想知道一個標籤的業務質量,就一定要進行投放測試才行。而且往往不同場景的一些投放帶來的結果也不太一樣,就導致業務質量的評估往往很難落地。
這確實是個難點。作者的經驗是,在評估標籤質量時,先重點考慮數據質量和應用質量,這兩者都沒問題的時候,就可以上線開放給業務使用。但對於業務使用標籤後的數據進行迴流,監控標籤應用在業務場景的價值情況。最終可以有個比較公允的衡量。而這個衡量,將對後面標籤的優化方向,帶來很強的指導性意義。
原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/269157.html
微信掃一掃
支付寶掃一掃