選秀魔術與倖存者偏誤

大數據時代,生活萬象都與統計學脫離不了干係,尤其強調數據績效的職業棒球更是如此;在近代職棒中,嶄新的科學儀器於球場日益普及,積累出大量資料,透過數據公司與科技部門專才的努力,每隔數年就有新的進階公式被創造與套用,冀望藉由這些獨創性的研究,探討這項有百餘年歷史的傳統運動裡更多不為人知的新天地。

然則數據真的不會騙人嗎?不盡然,因為解讀數據的人各懷心思,對同一份資料也會有不同的解讀和闡述,例如德州神槍手謬誤(Texas sharpshooter fallacy),這是指一個人朝牆壁開槍,再於彈孔最密集處畫上靶心,對外自誇為神槍手;此作法用於數據解讀,就是彙整資料過程汰除對自己論點不利的證據,只挑選能佐證自己論點的數據與案例對外闡述,也就是俗稱的「先射箭、再畫靶」。

在數據、案例研究中因私心而產生偏誤,除神槍手謬誤外,倖存者偏誤(Survivorship bias)也有異曲同工之妙,倖存者偏誤是指在特殊經歷過後的研究中,只關注倖存者樣本、忽略失敗者樣本,最終做出錯誤結論;在中華職棒裡最經典的案例,當屬桃猿隊的選秀會第七輪魔術。

猿隊在2013年藍寅倫、2015年朱育賢、2017年黃子鵬等幾位七輪入選者接連於職棒舞台大放異彩後,廣泛引發關注,也在後續幾年讓媒體與球迷目光側重於猿隊七輪秀誕生與升上一軍的表現;然則所謂的第七輪魔術實則是美麗的誤會,是別開生面的談資、是典型的倖存者偏誤。

倖存者偏誤,源於二戰時期統計學家與軍方共同研究歷劫歸來的戰鬥機,從機身受彈處多寡來探討飛機應在何處加強防護,方能降低被敵人砲火擊落的機率;軍方原論點是加強中彈最多的機翼處,因為從倖存歸來機體案例來看,此處應是最容易被擊中的位置。

但統計學家提出反論,認為應當加強回航機體樣本裡中彈最少的發動機處,學者認為此次研究樣本只有倖存回航戰機,不包含那些被擊落的飛機;而能返航的倖存者,中彈較多的機翼,反而是被擊中後不易導致墜毀的非要害處;倖存戰機上的發動機彈孔雖少,卻恰恰能說明此處正為要害,若中彈墜毀機率將大增,而後續實戰也證實了統計學家加強發動機防護的觀點確實是正確的。

從戰機研究到成功人物典範都是典型的倖存者偏誤。藍寅倫、朱育賢、黃子鵬等人克服了第七輪出身的嚴苛條件,成功存活並撼動職棒舞台,他們成為了成功典範,也具備過去所缺乏的鎂光亮度與媒體聲量,倖存者們的七輪出身,反而成為最好的行銷包裝,就像名人傳記所載,偉人獨樹一幟的處事風格和生活態度令人趨之若鶩;但更多被忽略的是比照辦理卻沒有話語權可以告訴你「為何這樣做會失敗」的凡人。

除了上述三個成功的七輪選秀,猿隊隊史還有2012年黃宗龍、2016年鄭佳銘、2018年范柏絜、2019年楊瑞承和2020年的何逸龍,除了轉隊的楊瑞承外,這些七輪新秀不是還在二軍浮沉為生存而戰,就是早已退出職棒舞台,這是被選擇性忽略的案例,也是那些無法成功返航揭露現實的戰機。

不可否認的是,猿隊近年選秀會上挖掘璞玉確有獨到眼光,球探部門的專業與努力累積了球隊成就霸業的資本,功績可謂斐然!然則所謂的七輪魔術,則是倖存者的美麗誤會、茶餘飯後引以為樂的談資,純屬巧合;或許未來面對七輪新秀時,給予適當應援,不過度賦予魔幻色彩,對於他們力爭上游所應得的評價將更恰如其分。

原文首發於:《職業棒球雜誌 》2021.08月號