解說兩種定律區別及聯繫「長尾定律和二八定律的區別」

對頻率分布中存在的「長尾」現象的統計學研究可以追溯到1948年美國哈佛大學語言學教授齊普夫(George K. Zipf)對英文文獻中單詞詞頻的分析和研究工作。齊普夫教授的研究成果指出,英語文獻中單詞的詞頻相對於序號的分布呈現一種冪函數分布,而不是正態分布(normal distribution)。由此,詞頻分布定律又被稱為齊普夫定律(Zipf’s law)[1]。而這種冪函數分布,被稱為「冪律」分布(power law distribution)[2]。

在我們的日常生活中,正態分布是非常常見的。比如,某一地區男性的身高,某一省的高考數學成績,某一型號比特幣礦機的平均使用壽命,等等。正態分布是一種較為「平等」的分布,因為大部分人的狀況都在平均值上下,彼此相差不會太多。特別高的和特別低的,都是比較罕見的。

但是同時,正態分布又是一種不太「公平」的分布。比平均選手高出6個標準差的高手,在數學考試中,或者運動場上,幾乎總是贏定那些平凡的無名之輩,讓後者望塵莫及。分數線一畫,沒過線的大多數人就慘遭淘汰。克勞特的《定位》理論,說的就是人們對於一種產品只能記住第一名,最多還能再記住一個競品和替代品,也就是第二名[3]。而更多的平庸選手,則只會被市場遺忘。

而冪律分布,則又是另外一幅景象。像人們的收入水平,單詞的詞頻,城市的人口,比特幣礦工擁有的算力,等等。冪律分布是一種較為「公平」的分布,雖然頭部20%的選手佔據了80%的市場,但是80%的長尾選手,仍然可以瓜分剩餘20%的市場。大佬吃肉,小弟喝湯。

不過同時,冪律分布又是一種不太「平等」、兩極分化的分布。它有一個通俗的說法叫做「二八法則」(80/20 rule)。20%的產品貢獻了80%的收入,20%的人賺走了80%的錢,花20%的時間就可以學到80分的水平(剩下20分的水平則需要花80%的時間才行),20%的美女被80%的男孩子追求,等等。

義大利經濟學家維爾弗雷多·帕累托(Vilfredo Pareto)在1896年研究社會收入和財富分布時發現了80/20的現象,後人將其理論命名為「帕累托法則」(Pareto principle)[4]。帕累托在他的著作《政治經濟學》(Cours d’économie politique)中指出了義大利大約80%的土地為20%的人所佔有的現象。

當然,帕累托的研究具有鮮明的時代特徵,而不能視為絕對的自然法則和永恆真理。在他做研究的時代,歐洲圈地運動已經成功驅逐和解放了農民,資本主義和工資工人階級興起,土地被集中佔有並通過法律作為私產保護起來,形成了帕累托所觀察到的現象。這一現象,是那個時代社會運動的結果呈現。

對於土地,也許應該像陽光、空氣和水一樣,又或者像一夫一妻制、一人一票制那樣,實行強制平均分配,並立法禁止兼并(正如《刑法》之「重婚罪」所做的那樣)。因為平均分布,是比冪律分布更公平的分布。人人平等,利益均分。

二八法則的兩極分化,特別是富人更富、窮人更窮的社會現象,還有一個說法叫做「馬太效應」(Matthew effect)[5]。馬太效應,1968年由美國科學史研究者羅伯特·莫頓(Robert K. Merton)提出,借喻自聖經《新約·馬太福音》:「凡有的,還要加倍給他叫他多餘;沒有的,連他所有的也要奪過來」,反映一種贏家通吃的現象。

當我們談論二八法則或者馬太效應的時候,有一個潛台詞就是,我們是在關注和強調頭部,也就是把注意力和精力放在20%的市場和客戶身上。因為我們的精力和時間實在有限,所以需要聚焦於20%的頭部,而忽視剩下的80%的長尾。

2004年10月,美國《連線》雜誌主編克里斯·安德森(Chris Anderson, 1961-)在《連線》雜誌發表了一篇有關「長尾理論」(the long tail theory)[6]的文章,在文章中,他提及了亞馬遜、蘋果和雅虎等公司,並用「長尾」的概念來闡述互聯網企業的商業模式和戰略,迅速帶火了這個概念。2006年7月,他趁熱打鐵出了一本書,《長尾:為何未來商業會向更多人賣的更少》(The Long Tail: Why the Future of Business Is Selling Less of More),成為全球暢銷書和企業必讀書籍。當時國內幾乎所有互聯網企業,都進行了集體學習和專題研討。

我們需要注意的是,長尾理論和二八法則、馬太效應談論的還是同一個分布,冪律分布,但是,兩者的差異主要在於關注點不同。二八法則強調的是頭部,而長尾理論強調的是長尾。

長尾理論主要試圖指出,如果我們可以瞄準過去被忽視的長尾市場,又稱「利基市場」(niche market),那麼我們可能會驚喜的發現,這個狹窄而冗長的市場,其需求之和、整體利潤足以與頭部市場的總量相媲美。問題主要在於,服務這樣一個狹長的、個性化的市場,對傳統商業模式而言,邊際成本是不經濟的。但是互聯網技術的發展使得我們可以建立規模化的計算機集群,24小時不間斷的為極其大量的用戶同時提供高度個性化的服務,而保持極高的服務效率和極低的邊際成本。這就提高了商業效率,使得從利基市場中萃取大量微小价值成為可能,從而改變了只關注頭部客戶的傳統商業模式。比如,Tiktok的伺服器集群可以同時為全球上百萬同時在線的用戶各自推送完全個性化定製的內容,而新增一個用戶所需要增加的邊際成本低到幾乎為零。這就是互聯網服務和商業模式能夠勝過傳統商業模式的主要原因之一。

中本聰在2008年11月3日的郵件中闡述殭屍集群挖礦問題時借用了「長尾」這一概念,指大量的中小集群的算力之和加起來可以匹敵少量頭部集群的算力的情況[7]。這種情況能夠出現,則有賴於比特幣遊戲規則下哈希算力的分布符合冪律分布。

我們已經從中本聰的論壇發言中知道,「每天通過網路生成的比特幣總量平均而言保持不變。較快的機器比較慢的機器獲得更大的份額。如果每個人都購買更快的機器,他們將不會獲得比以前更多的幣」(中本聰,2009年12月12日論壇帖子)[8]。因為在一個短期內,每個新區塊的幣基交易發出的新增比特幣的數量是一個固定大小的蛋糕,而所有礦工的所謂挖礦,就是比賽算力來爭搶和瓜分這個蛋糕。

在中本聰於2009年1月13日單獨寫給達斯汀·特拉梅爾(Dustin Trammell)的私人郵件中,他這樣寫道:「這不像賽車,如果一輛車快兩倍,就總是會贏。這是SHA-256運算,每次花不了1毫秒,而且每次都有獨立的成功機會。每台計算機找到哈希碰撞的機會與計算能力成正比。一台慢一半的電腦會得到一半的比特幣。」[9]

這個特點是和比特幣挖礦競賽是SHA-256哈希運算這一設計密不可分的。關於這一點,中本聰早在2008年11月15日的密碼學郵件列表中就已經公開指出[10]:

「如果你將其視為CPU密集型的數字簽名,那麼您可能會把它當作一個搶先完成長時間操作並以最快的速度獲勝的比賽。」

但是實際上,「工作量證明是一種哈希現金那樣的SHA-256碰撞搜尋。這是一個無記憶的過程,你每秒鐘進行數百萬次哈希計算,每次有一個很小的機會找到。最快的3或4個節點的優勢僅與它們在總CPU算力中所佔的份額成正比。任何人在任意時刻找到答案的機會都與他們的CPU算力成正比。」

就像比賽扔硬幣的遊戲。誰率先扔出連續100個正面,誰獲勝。那麼,我們知道,在任一時刻,你的獲勝概率只和手速成正比,而與你在此之前扔過多少次硬幣沒有任何關係。這就叫做「無記憶過程」(memory-less process)。這樣的遊戲,保證了任何時刻加入的新玩家都能夠公平地參與到競爭中來。

這就是基於PoW (Proof-of-Work)工作量證明的共識演算法的公平之處。相比之下,像基於PoS (Proof-of-Stake)權益證明或類似變體的共識演算法,就因歷史持幣量不同而獲得額外的競爭優勢,從而獲得更多量的幣,若其繼續用新幣強化其權益證明,則愈發增強其競爭優勢,對後進入的新玩家就會不夠公平。

長尾理論!

原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/290009.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
投稿專員的頭像投稿專員
上一篇 2024-12-24 03:21
下一篇 2024-12-24 03:21

相關推薦

發表回復

登錄後才能評論