那些人均收入數據,為什麼看上去這麼不可靠?

一、此收入非彼收入
人均收入一直是網上容易引發爭議的話題,一邊是網上社區各種「人均百萬」的誇張描述,一邊又是各種「X億人收入不足1000元」的話題,一邊是官方發佈的平均薪金,一邊是有人齊歎「自己拖群眾後腿了」。
統計數據容易被人詬病,其實有一個很重要的原因,統計是一個有專業門檻的事,每一個數據都有自己的統計口徑和統計方法,但媒體在傳播時,往往只想當然地摘錄其中的幾個數據,而忽略「統計口徑與方法」,很多收入數據,跟大部分人想像中的薪金單上的數字,並不是一回事。
比如之前,國家發展改革委就業收入分配和消費司同北京師範大學中國收入分配研究院,共同發佈的調研報告數據顯示,9.64億人月收入2000元以下,佔中國人口數量的68.3%,5.47億人口月收入低於1000元,佔39.1%。

這一數據後來成為多個數據的來源,引發了很大的爭議,實際上就跟統計口徑有關。
另外,很多人喜歡把中國的收入數據跟國外比較,但用的卻是不同口徑甚至意義完全不同的收入數據,變成雞同鴨比。
收入統計數據雖然口徑比較多,但基本上就是兩類:人均可支配收入和薪金收入,本文就來聊一聊這兩類收入數據的定義、統計方法和特點,最後再談一談「9億人收入不足2000元」這個數據應該怎麼看。
二、人均可支配收入
如果你是一個年薪50萬的金領階層,但在官方人均可支配收入的統計數據中,你可能只有8萬多,這是為什麼呢?
首先,「人均可支配收入」的定義是某地區的總可支配收入除以全部常住人口總數。
分子的可支配收入,不光包括薪金收入,還包括經營淨收入(個體經營活動所得的利潤)、財產淨收入(租金、利息、股息等)和轉移淨收入(補助、養老金、失業保險金等)。
所謂「可支配」,是收入再減去稅款、社保以及轉移支付等後賸餘的部分。
而分母包括了該地區的所有人,不但包括有收入的,也包括沒有收入的老人孩子、全職主婦、失業人員等。
分子減少,分母增加,所以人均可支配收入通常低於我們平時感知的收入。
還有,雖然人均可支配的定義是總可支配收入除以全部人口,但其實際統計方法仍然是抽樣,以家庭為單位,以分層抽樣的方法只統計樣本數據,要求樣本覆蓋不同地區、城鄉、收入層次的家庭。
如果今年抽中你家,你一家五口,雙職工加一個孩子加兩個老人,此時會有調查人員上門,統計你們夫妻和老人的所有家庭可支配收入,雖然你是年薪50萬的高收入階層,但扣稅後的可支配收入只有30多萬,而妻子的收入和老人的退休金都不高,再加上一個沒有收入的孩子,又沒有其他收入來源,最後這五個人的年人均可支配收入就是8萬多,只比2023年統計局公佈的全國城鎮居民人均可支配收入的51821元,高出60%多,如果明年喜得二胎,年人均可支配收入又下降至7萬多,接近全國平均水平。
很多中產家庭如果丈夫的收入比較高,妻子會選擇成為全職太太,或者換一個說法,全職主婦(夫)的前提是另一方有高收入,這樣也拉低了高收入家庭的平均可支配收入。
人均可支配收入與體感的差異的另一個原因是收入構成。
2023年的全國居民人均可支配收入39217.97元中,薪金性收入為22053元,佔比僅56%,財產收入佔比8.6%,轉移收入佔比18.5%,經營性佔比16.7%。大部分人只有薪金性收入和轉移收入,自然又差了一個級別。
而媒體經常使用的另一類收入數據——職工平均薪金收入,就跟大部分人的體感符合了。
三、職工平均薪金收入
「職工平均薪金收入」數據來源是由統計局定期收集企事業單位的薪金數據,包括社保繳費基數、勞動合約備案等,再加上抽樣調查統計出來的。
首先,這個數據分為非私營單位和私營單位兩類,前者2023年全國的數據是人均年平均薪金為120698元,後者是68340元,均為稅前,包括所有的基本薪金、獎金津貼、加班薪金等,還包括個人應繳的社保部分,即國有企事業單位稅前月薪1萬,民營月薪5700元,跟我們平均感知的月薪更接近。
很多新聞報導者缺乏專業知識,把這兩類數據搞混了,而讀者也無法區分,容易造成對新聞的誤讀。
這個數據也分地區發佈,2023年上海的非私營和私營分別為229337元和111347元,相比2023年上海的人均可支配收入8.48萬元,前者更符合薪金單上的稅前數字,後者更接近雙職業家庭加一個孩子後的人均數。
值得注意的是,私營企業職工收入僅相當於國有企事業單位的56.6%,這個差別也比一般人想像得大,主要是因為這裏統計的私營企業職工,還包括靈活就業和工商個體戶,而且薪金數據來源主要是社保繳費基數,很多私營企業都在按最低薪金報社保。
而且,就業「大戶」但薪金較低的批發零售、製造業、建築和住宿餐飲等行業,都以私營企業為主,拉低了私企的整體薪資水平,而高收入的信息技術和金融員工在國有企業員工總數中的佔比,又高於私營企業佔比。
還有,私營企業的職工佔了80%的就業人數,數量多導致薪金差別遠遠大於國企職工,薪金天花板的互聯網大廠和大量的城郊小工廠,都屬於私營企業,後者在互聯網公共事務討論中屬於「沉默的大多數」。
此外,低線城市的私營企業更缺乏高薪職業,導致國企私營的差距比一線城市更大。
四、北師大數據與統計局的數據
回到前面的北師大收入調查數據,很明顯,這個數據應該指「人均可支配收入」而非「薪金收入」。不過,就算是人均可支配收入,雖然是2019年的數據,68.3%低於2000元看起來也有點多啊。
但再看看具體構成上,就明白了,1090元以下和1090-2000元這兩組,農村人口佔比數別為76%和53%,中西岸分地區分別佔71%和56%,初中及以下學曆分別佔80%和68%,不就業和自雇者分別佔63%和58%。
只能說,2019年的中國,中西岸農村地區低學曆難就業者,實在太多了。
不過,這份數據跟統計局的數據還是有一些衝突的。
這份報告給出的中位數大約在1400元左右,沒有給平均數,但大致可以算出在1850元左右,而統計局給出的2019年中國人均可支配收入為3.07萬元,相當於月收入2558元——兩個統計口徑理應差不多的數據,實際差別有點大。
假設兩個數據的統計方法有一定的差異,我們還可以從另一個角度看,北師大的數據,平均數比中位數高32%;統計局給出的2019年全國居民人均可支配收入中位數26523元,平均數比中位數高15.7%。
平均數與中位數的比例代表貧富分化的程度,統計局給出的數據,貧富差距更小,這可能是兩個數據有點差別的原因。
為了直觀比較這兩個數據的差異,可以參考一下其他國家人均數與中位數的比例,需要注意的是,各國的統計口徑不同,有些數據是人均收入,有些是職工薪金收入,不能橫向比較。
先看看日本,根據2023年的數據,日本普通勞動者的平均年收入(就業薪金數據的口徑)約為381.96萬日元,年收入中位數為360萬日元,平均數是中位數的6.1%,符合日本貧富差距比較小的一貫形象。
再看一看德國,2020年德國的人均收入(就業薪金數據的口徑)約為47,000歐元,而收入中位數約為44,000歐元,平均值比中位數高6.8%,跟日本差不多。
最後看一看美國,美國分為個人收入和家庭收入數據,2023年,個人平均收入(就業薪金數據的口徑)76,000美元,比中位數48,060美元,高58.1%;但另一個家庭收入數據,2023年平均收入94,000美元僅比中位數80,610美元,高約16%。
個人收入和家庭收入差異大的原因,我在前面也提到了,低收入家庭兩人都要上班,高收入家庭更傾向全職太太,從而縮小了家庭收入的差距。
家庭收入的口徑更類似於我國的人均可支配收入的口徑(假設戶均人口差不多),所以,如果按統計局的數據,2019年,我們的貧富分化跟美國差不多,如果按北師大的數據,我們的貧富差距超過美國。
我個人覺得,兩個統計數據的念頭,跟它的抽樣規則有關,抽樣都有一個樣本,比如按20%分為五等分,2023年的五等分數據為:
-
低收入組人均可支配收入平均為9215元;
-
中間偏下收入組人均可支配收入平均為20442元;
-
中間收入組人均可支配收入平均為32195元;
-
中間偏上收入組人均可支配收入平均為50220元;
-
高收入組人均可支配收入則平均為95055元。
但樣本哪裡來的呢?去年的。去年的樣本哪裡來的呢?前年的。
所以樣本本身對最後的統計結果有很大的影響。北師大的數據的低收入佔樣本的比例必然大於統計局的。
這個偏差是如何出現的呢?比如統計局今年抽樣幾萬個彙總後,發現高收入家庭佔比有點少,跟去年的不符,最終都要按去年的比例抽樣,這麼做的好處,每一年跟上一年相差不大,可比較性強,所以同比數據更有意義,但排除收入差距的細微變化,由於統計局的統計歷史更久,為了保證數據的連續可比,誤差一年累積一年,經過多年後,樣本本身的代表性,就有一定的偏差了。