如今,信息流的產品形態已經貫穿到我們的生活中,與一切都息息相關。每日清晨打開今日頭條,齊刷刷的熱點資訊等着大家去閱讀;休息時點開小紅書,無數條種草點評映入眼帘;一到飯點飢腸轆轆時點擊大眾點評,不計其數的同城餐廳等待我們去挑選……在現今的移動互聯網時代,平台通過成熟精密的召回算法和排序規則來聚合內容,用戶在一個頁面內就可以高效流暢地獲取自己感興趣的內容。
在以往文章中,我們講述過關於信息流內容產品的指標搭建、常見分析思路和優化方法。那麼,構建一個最基礎的信息流產品,需要哪些部分?每個模塊具體如何操作以及它的作用是什麼呢?今天的這篇文章里,大家就能知道想要的答案啦。
一個最基礎的信息流產品,涵蓋了哪些部分?
1、內容:內容生產、內容理解、內容加工
2、用戶:用戶理解
3、策略:召回/推薦策略、分發策略、生態策略

圖示是構建信息流產品所需的基礎大框架,接下來逐個分析各模塊具體操作及對應作用。
一、內容生產
內容生產即內容的供給,有需求就要有供給,只有供給充足,用戶才能消費到足夠多樣精彩的內容。通常有以下幾個方式生產內容:
1、自然創作者在站內發佈內容
2、簽約媒體及MCN等機構購買一些創作者/內容資源
3、抓取其他平台符合調性的內容。
在不同的產品目標階段,不同來源類型的內容配比會不同。一些成熟的平台已經有非常完善的創作者生命周期管理和創作者激勵/分成體系,由此可激勵創作者發佈更多更優質的內容。可見,內容供給就是內容型產品的根本。
二、內容理解
內容理解即給內容打標籤。標籤——描述內容本身的特徵,可以更好地理解內容,將合適的內容推薦給合適的用戶。基於內容理解的標籤有非常多的用途,除了作新用戶的內容推薦外,可以作基於相似標籤的相關內容推薦,也可以作個性化的內容推薦。內容通過海量標籤生產內容特徵,和用戶的偏好進行匹配,形成千人千面的內容分發方式。
內容理解需要大量NLP方法,以及大量人工標註,用以確保標籤的準確性。通常可以從內容本身和發佈內容作者屬性/行為來理解內容。例如一個短視頻作品,它的標籤就可以涵蓋:
1、基礎屬性:時長、封圖、標題、關鍵詞、城市、來源等
2、類別屬性:城市新聞、娛樂、貓狗等
3、預測類屬性:原創度、風險分、內容評級、內容時效性、女生偏好、年輕人偏好等
三、內容加工
不論任何渠道抓取、站點抽取或者平台作者自主發文的內容,通常都需要經過層層加工過濾。首先進行通用消重,然後通過機器審核的一些模型及人工審核過濾掉黑名單、低質內容、抄襲內容、不完整內容、涉黃涉暴等不適合在平台內展現的內容。然後在內容分發過濾時根據對應規則,設定對應特徵的內容可以分發給對應特徵的用戶等規則,例如用戶評級評分、垂類等進行分發過濾。到了前端展示側,根據頻道主Feed頁的推薦位進行個性化推薦分配,展示給用戶。最後內容展示一定時間後會喪失其時效性,便不再展示。

四、用戶理解
用戶理解即精準地去刻畫用戶,涵蓋用戶的基礎信息,職業、年齡、性別等,以及基於用戶過往行為數據興趣偏好標籤,從這些數據中,我們可以獲取大量的用戶特徵,對用戶有更深層次的認知,例如這個用戶喜歡什麼類型的內容?更偏好什麼類型的賬號發文?活躍時間在每天的幾點?基於此可以從不同的維度去刻畫一個用戶,我們刻畫得越精準越詳細,就越能精準地發現並挖掘用戶的需求,把用戶所需內容推薦給目標用戶,內容轉化效率將會變得更高。

五、推薦與分發策略
推薦策略是基於海量數據分析基礎上,通過內容及用戶的多維度特徵組合分數,進行計算,將個性化內容推薦給對應用戶,解決信息過載的問題。推薦通常分為兩個階段,即召回和排序。召回是根據用戶的一些特徵偏好或者一些特殊規則,在偌大的內容池中挑選出一個內容集合,圈定推送內容。常用的召回方法有:基於FM模型組合特徵召回、基於行為的item協同過濾、基於行為的user協同過濾等手段等。召回池中都是用戶感興趣的內容,而排序階段會在此基礎上進行更精確計算,對每個內容進行打分,從召回池的內容中挑選出用戶最感興趣的少量內容。
內容的分發方式除了推薦算法外,還應該考慮內容多樣性等因素,我們可以基於內容生態的考量,對內容創作者從不同的維度進行打壓與推優,把更多的流量分配給優質內容的創作者,提高流量的利用效率和被消費內容的質量。例如我們會對原創評級更高、質量評級更高的作者給予更多的流量。此外,還可以基於社交進行分發(抖音的關注頁頻道),與地理位置的分發(抖音的同城頻道、以及熱榜內容分發)。
六、生態策略
早期產品做冷啟動時,內容和創作者數量都遠遠不足,需要通過外部手段來激活站內生態,由此不得不抓取大量的站外內容到站內,相應就無法保證內容質量。但隨着產品的發展,亟需一批優質+原創的內容來替換原始抓取的內容,藉此讓站內擁有更多的真人優質創作者,來構建更加健康可持續發展的作者及內容生態。促進UGC的生產可以通過一些運營活動、簽約MCN/官方招募、社區內容引導等方式。同時設計相應策略保證頭部生產者的內容權益,對底層劣質創作者的內容進行打壓,通過針對不同程度的劣質/違規進行不同的手段打擊,最終讓站內保持一個良性的循環生態。
我們不僅要處理站內的違規用戶和違規內容,還要針對一些擦邊的生態問題制訂對應的干預策略。如果站內若存在大量的低俗內容、負能量內容、炒作搏眼球內容等,雖然這些內容並不違規,若其量級夠大則嚴重影響用戶的瀏覽體驗。根據我們目前的產品階段及調性,通過模型及人工方式對不同的生態類問題內容進行識別,實施相應的處置及規則設定,以維護站內健康正向的內容生態。
以上,就是我理解一個信息流內容產品的主要框架,還有非常多的細節點
原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/323147.html