資訊傳遞失真率

很明顯標題有個「率」表示這是一篇有大量計算的文章,所有資訊都是有依據的,但是這篇文章並不帶有嘗試影響各位價值觀的意味,請確定保持您思想的客觀性後入內觀賞,若是被本文影響概不負責。

在開頭來個與本文只有少許關聯的謎語:你來到一個三岔路,一邊是通往老實村,另一邊是通往說謊村,但你並不知道哪條路是通往哪個村子。而老實村的村民不管你問什麼都會照實回答,而說謊村的村民不管你問什麼都會以假話回答,恰巧這時候有一位不知道來自哪個村子的村民站在路口,你只能問他一個是或否的問句,你如何能判斷出哪邊是老實村呢?

歡迎各位暫停稍作思考,解答在文末。

進入本文。

首先先舉一個例子方便各位理解,請看下圖:



假設一個人持有正確情報(以T表示正確,F表示錯誤),他告訴0.9(90%)的人正確,0.1的人F,而其餘的人也依此方式傳遞下去,當然有些人持有F並告訴0.1的人錯誤的情報,也就又變成了T。

到了第三層,計算一下T與F的總數會發現T=0.756, F=0.244,和原來第一層的T=0.9, F=0.1相差了許多,以此類推傳遞下去的話,會變成如下狀況:

  T F
0 100 0
1 90 10
2 82 18
3 76 24
4 70 30
5 66 37
6 63 37
7 60 40
8 58 42

相信各位很容易觀察的出來,T和F的值會漸漸趨近50,也就是T和F漸趨相等。

這種情況不只是在0.9正確的情況下發生,不論資訊傳遞的失真率是多少,都會漸漸趨近於「半真半假」,以下是證明及公式推導。

(pf)

設a是失真率(正,前文的0.9),b=a-1(負值),因此當數字為正時情報為T,負時為F。

設n是第幾次傳遞(幾層),T為真情報的比率,F為假情報的比率的相反數(0“<"T“<"1, 0<-F<1)



根據上圖可以得到以下算式:

if n=1→T=a, F=b

if n=2→T=a2+b2, F=2ab

if n=3
→T=a3+3ab2, F=3a2b+b3
if n=4→T=a4+6a2b2, F=b4+4a3b+4ab3

整理以上式子後發現:

if n=1→T+F=a+b
if n=2→T+F=(a+b)2

if n=3→T+F=(a+b)3

if n=4→T+F=(a+b)4

if n=k→T+F=(a+b)k
又因為T與-F皆為比率,相加為1(100%)。

因此得到T-F=1。

聯立 T+F=(a+b)n …(1)

T-F=1 …(2)

得到T=[(a+b)n+1]/2

又因b=a-1,可化簡為T=[(2a-1)n+1]/2

取極限,limn→∞(2a-1)n=0, limnn→∞
[(2a-1)n+1]/2=0.5,故正確率T及錯誤率-F皆會趨近相等得證。
且根據公式只要輸入變數(失真率, 層數)=(a, n),即可求出正確率T。

證明部分告一段落,整理一下,到這邊已經導出了藉由確認「資訊失真率」、「資訊傳遞層數」,即可求出「資訊正確率」的理論值公式。此為上半部。

但是到目前為止,都還是在純理論的階段,在現實生活中沒有人統計過所謂的「失真率」,因此我要根據部分的數據計算出現實世界的資訊傳遞失真率。

首先根據統計,人類說話速度為每分鐘85字,人類說話頻率為每分鐘60字,人類說謊頻率為每10分鐘說3次謊。計算後得到說話速度為1.4167字/秒、說話頻率為1字/秒、說謊頻率為200秒/次。整理後,每200秒說1次謊,其中講了200字共花了141.67秒,因此說謊率計算出為:每141/200=0.705,也就是a值。

再來,根據六度分隔理論,人與人的平均距離最多只隔了六個人,因此此層數(n)在一定的機率下必不超過6。

因此將(a, n)=(0.705, 6)代回公式後得到T=0.5023750521205。

此為結論。

順便附上在a=0.705的情況下,

n=1時,T=0.705

n=2時,T=0.584

n=3時,T=0.534

n=4時,T=0.514

n=5時,T=0.506

n=6時,T=0.502

由此篇可以得知,資訊的傳遞經過越多手消息,可靠性皆會大大的降低,包含在第一手資訊情況內可信度只有0.7,所謂成語「半信半疑」大概就是在描述此種情況吧。仔細想想,我們平常接觸到的資訊媒體,至少都是經由提供者→整理者→報導者→接收者之三手消息,在合理範圍內判斷所有資訊可信度約五成並不為過吧。

當然了,這篇也只是理論,並沒有考慮進真實資訊的複雜程度,包含:資訊不一定為是非命題、資訊可能牽涉到商業或政治等因素而a會遠小於0.705、資訊提供者及傳遞者的嘴殘狀況、資訊傳遞者及接收者的耳包狀況、電子訊號傳遞所產生的自然失真、資訊經手人的個人信用程度、資訊接收者的個人信任度價值觀、資訊接受者的個人心理變態程度、資訊本身所牽扯到的附加利益或成本產生的影響、資訊經手者本身的人際關係、資訊本身與道德或法律相違背的狀況、資訊本身並非資訊的狀況、資訊經過多國語言翻譯產生的失真、資訊經過聽說以外的管道產生的理解錯誤…等等狀況無法一一列舉。

重點:請抱持半信半疑。

在第一段提到的謎語,在此公布答案:只要你問他:請問你的村子在右邊嗎?

引用及參考文獻部分:

誠實村以及說謊村之謎語:《應急詭辯術》,廖英迪,大展出版社有限公司。

靈感及部分計算表示方式:《應急詭辯術》,廖英迪,大展出版社有限公司。

人類說話速度平均每分鐘85字:由演藝公會統計。

人每10分鐘說3次謊:統計,心理學家保羅‧艾克曼。

六度分隔理論:連鎖信實驗,心理學教授斯坦利‧米爾格拉姆,維基百科

感謝您的欣賞,歡迎提出批評。

在〈資訊傳遞失真率〉中有 2 則留言

  1. 那謎語好像是某本書裡面的
    書名叫什麼來著的我忘了..

    好吧整篇我只有那謎語看得懂= =

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。