版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
鐘形曲線(xiàn)上的窄尾巴2016年2月17日14:54
閱讀409TailsofGreatSoccerPlayers偉大足球運(yùn)動(dòng)員的窄尾分布作者:Jacob@2015-11-19
譯者:Veidt(@Veidt)
校對(duì):Drunkplane(@Drunkplane-zny)
來(lái)源:PutANumberOnIt!,/2015/11/10/003-soccer1/Isn’titstrangethattheChinesearen’tworldchampionsineverysingleteamsport?Here’swhyit’sstrange:Chinahas19%oftheworld’spopulation.Forindividualsportsthatmaynotbeahugedeal:iftennisabilityandopportunityaredistributedequallyaroundtheworld,therewouldbeonlya19%chancethatthebesttennisplayerhailsfromChinaand81%thatheis
Swiss,
Serbian,
Spanish,
Scottish
orfromanyothercountry.Itissomewhatsurprisingseeingthetop5superiorserversandstrikersofsoftspringysphereswithswingsofstringedracquetsallcomefromsovereignstatesthatstartwith“S”,butthat’saseparatestory.中國(guó)沒(méi)能在所有團(tuán)隊(duì)運(yùn)動(dòng)項(xiàng)目中成為世界冠軍著實(shí)是件奇怪的事情。這之所以奇怪,是因?yàn)橹袊?guó)擁有著全世界19%的人口。對(duì)于個(gè)人運(yùn)動(dòng)項(xiàng)目來(lái)說(shuō),也許這個(gè)數(shù)字還并不算太大:如果打網(wǎng)球的能力和機(jī)會(huì)在全球均等地分布,那么全世界最好的網(wǎng)球運(yùn)動(dòng)員來(lái)自中國(guó)的概率僅有19%,而他來(lái)自于瑞士,塞爾維亞,西班牙,蘇格蘭或者任何其它國(guó)家的概率則有81%。全世界最具統(tǒng)治力的5名網(wǎng)球選手都來(lái)自于國(guó)名以“S”開(kāi)頭的國(guó)家這件事情的確有點(diǎn)令人吃驚,但那是另一件事情。Inteamsportsthatshouldbedifferent.IfsoccertalentwasequallyspreadChinashouldhaveonaverage19ofthetop100playersineachgeneration,almostneverlessthan11.CountrieslikeSpain,GermanyandFranceontheotherhandwouldexpecttohave1playerinthetop100,maybe2or3ifthey’relucky.ThatwouldbenomatchfortheloadedChinesesquad.Evenatop3playercan’tdominateallbyhimselfinateam-basedsportlikesoccer,asevidencedbythebelowpictureofsadRonaldo.在團(tuán)隊(duì)運(yùn)動(dòng)中情況則完全不同。如果踢足球的天賦在世界上均等地分布,那么平均而言,在每一代世界上最好的100名球員中,中國(guó)會(huì)擁有19個(gè),而這個(gè)數(shù)字幾乎絕不可能低于11。另一方面,西班牙,德國(guó)和法國(guó)這些國(guó)家則通常只會(huì)有1名球員進(jìn)入全球前100名,即使幸運(yùn)的話(huà)也最多只有2或3名。而他們的隊(duì)伍應(yīng)該完全無(wú)法與皆由精英組成的中國(guó)隊(duì)抗衡。畢竟,即使是排名世界前3的球員也無(wú)法在足球這樣的一項(xiàng)團(tuán)隊(duì)運(yùn)動(dòng)中靠一己之力統(tǒng)治比賽,下圖中C羅悲傷的表情充分證明了這一點(diǎn)。Andyet,theChineseteamisnotgoodatsoccer,andI’mputtingthat
milderthansome.TheChinesemen’snationalsoccerteamisranked
84thintheworld,afewspotsbelow
AntiguaandBarbuda
–anationwithapopulationof90,000.That’sroughlyequaltoasingleneighborhoodinShanghai.但實(shí)際上中國(guó)足球隊(duì)的水平并不高,而我的這種表述方式已經(jīng)比一些人溫和得多了。中國(guó)男子國(guó)家足球隊(duì)的世界排名是第84位,他們的積分比安提瓜和巴布達(dá)還要低上幾分,而這個(gè)國(guó)家的人口僅有9萬(wàn),幾乎只相當(dāng)于上海的一個(gè)街區(qū)。Motivationisoftenbroughtupasanexplanation:perhapstheChinesehavethetalentandopportunitytoplaysoccer,but
all1.3billionofthem
choosenotto.Perhapsinsteadofplayingsoccertheychoosetostudy.Thosethatplaysoccertheleastandstudythemostcangointomedicine,andthosethatstudyhardestofallandhavenoroomforsoccermakeitintotopmedicalschoolsintheUS.常被提到的一個(gè)理由是動(dòng)力不足:也許中國(guó)人擁有踢足球的天賦和機(jī)會(huì),但是13億中國(guó)人卻選擇不去踢。也許他們寧愿把時(shí)間花在學(xué)習(xí)上。那些踢球踢得少,讀書(shū)讀得多的孩子可以去學(xué)醫(yī),而那些在學(xué)習(xí)上最用功以至完全沒(méi)時(shí)間踢球的孩子將在未來(lái)進(jìn)入美國(guó)最好的醫(yī)學(xué)院。Certainlywedon’texpect
those
Chinesetoplaysocceratall,andyetbelowisagroupphotooftheEmoryUniversitymedicalschoolsoccerclub.ThesummerIwasthereweplayedatleast4hoursaweek.Youcaneasilyfindmeonthephoto,I’moneof
threenon-Chinese
peopleontheteam.顯然我們不會(huì)相信中國(guó)人完全不踢足球,下面是一組埃默里大學(xué)醫(yī)學(xué)院足球俱樂(lè)部的照片。在那個(gè)夏天,我每周至少在那里踢上4個(gè)小時(shí)足球。你可以輕松地在照片上找到我,我是那支球隊(duì)里僅有的三名非華人球員之一。Thesuccessofanationalsoccerteamshoulddependontwofactors:thepoolofavailableplayers(population)andsomecombinationofnaturaltalent,infrastructureandopportunitythatdetermineroughlyhowsuccessfulanaveragepersoninthatcountrycanbeatsoccer.I’llcallthecombinedsecondthing
nationalsocceraffinity,andwillimmediatelynotethatit’sa
huge
simplificationtothrowsomanydisparatethingsintoasinglefactor.一支國(guó)家足球隊(duì)的成功主要依賴(lài)于以下兩個(gè)因素:可供他們選擇的球員人數(shù),還有某種天賦、基礎(chǔ)設(shè)施和機(jī)遇的組合,這大體上決定了這個(gè)國(guó)家的普通人能在足球方面所能達(dá)到的平均高度。在后文中我會(huì)將這種組合稱(chēng)作一個(gè)國(guó)家的“足球親和性”,并會(huì)很快提到將如此多不相關(guān)的東西整合到一個(gè)因子里實(shí)際上是一種極大的簡(jiǎn)化做法。Mygoalistoseparatetheeffectsofpopulation,soaffinityisbasicallyeverythingthat’sindependentofacountry’stotalsize.Iammakingnoguessesregardingthecomponentsofsocceraffinity(maybeit’sallabouthavingenoughsunshinedaysforkidstoplayoutdoors),onlyinthecomparisonbetweencountries.ThequestionIwanttoinvestigateis:我的目標(biāo)是將人口因素單獨(dú)分離出來(lái),所以“親和性”這個(gè)概念基本就是所有與一個(gè)國(guó)家的人口數(shù)量不相關(guān)的因素。我也不會(huì)對(duì)“足球親和性”這個(gè)概念的具體組成做任何的猜測(cè)(也許它只涉及有足夠多晴朗的日子讓孩子們?cè)谑彝馓咔颍鴥H僅是在國(guó)家之間進(jìn)行比較。我想探索的問(wèn)題是:Relativetotheirpopulation,whichcountriesarethebestandworstatsoccer?Andwhy?
相對(duì)于其人口數(shù)量,哪些國(guó)家在足球方面做得最好?而哪些國(guó)家又做得最差?為什么?Ifweimaginethatsocceraffinityis
normallydistributed,acountry’spopulationisthesizeofthebellcurveandthenationalaffinityishowfartotherightontheabilityaxisthecenterofthebellcurveis.Thelevelofacountry’snationalteamishowfarontheabilityaxisthebest11menandwomenare.如果我們假設(shè)“足球親和性”這個(gè)因子服從正態(tài)分布,一國(guó)的人口就是鐘形曲線(xiàn)的面積,而一個(gè)國(guó)家的“足球親和性”則可以被定義為鐘形曲線(xiàn)的中心線(xiàn)在能力軸上的投影與原點(diǎn)之間的距離。而該國(guó)國(guó)家隊(duì)的水平則取決于該國(guó)最優(yōu)秀的11名男球員和女球員在能力軸上所處的位置。Clearly,havingalargerbellcurve(morepeopleateverylevelofplay)andshiftingthecurvetotheright(betterplayersonaverage)should
both
contributetoboostingthelevelofthenationalteam.Thefactthatthereareover15,000
ChineseforeachAntiguan,andyetthesoccerteamsarecomparableinlevel,presentsthefollowingpuzzle:很顯然,擁有一個(gè)面積更大的鐘形曲線(xiàn)(在各種水平上都擁有更多的人口)以及讓鐘形曲線(xiàn)向右移動(dòng)(更高的球員平均水平)都有助于提升一國(guó)國(guó)家隊(duì)的水平。而中國(guó)的人口是安提瓜人口的15000倍,但這兩國(guó)的國(guó)家隊(duì)水平卻處于同一檔次這一事實(shí)則向我們提出了如下的難題:Whydoesitseemthatnationalteamleveldependsonaffinitymuchmorethanonpopulation?
為什么國(guó)家足球隊(duì)的水平對(duì)“足球親和性”的依賴(lài)程度要遠(yuǎn)遠(yuǎn)高于對(duì)人口的依賴(lài)程度?Theanswertothatpuzzleis:
Becausethetailsofanormaldistributionfallmuchfasterthanyouthink.而這個(gè)問(wèn)題的答案是:因?yàn)橐粋€(gè)正態(tài)分布的尾部下降的速率比你想象的要快得多。Inplain(er)English:everypointonabellcurveissomedistanceawayfromthemiddle(themean).Thefurtherawayfromthemeanyougothelesspointsthereare(lowercurve).Thesedistancesareoftenmeasuredinstandarddeviations,orSD,shownbytheverticalredlinesonthepicture.Onastandardbellcurve,justover68%ofthepointsarefoundadistanceoflessthan1SDfromthemeanineitherdirection.更直白的就是:鐘形曲線(xiàn)上每個(gè)點(diǎn)和中心(也就是平均值)都存在一個(gè)距離。與平均值的距離越遠(yuǎn),這個(gè)水平上的點(diǎn)數(shù)也就越少(在曲線(xiàn)上就越低)。而與中心的距離通常是以標(biāo)準(zhǔn)差計(jì)的(在圖中用紅色的垂直線(xiàn)條表示)。在一個(gè)標(biāo)準(zhǔn)的鐘形曲線(xiàn)上,有68%的點(diǎn)都會(huì)落在均值兩端一個(gè)標(biāo)準(zhǔn)差的距離之內(nèi)。Lookingnaivelyatthefamiliarbellpicture,itseemsthatthecurvedropssharplyoverthefirst2or3SDtoeithersideandthenlevelsoffaround0whenyoumovefurtheraway.That’sextremelymisleading:the
relativeheight
ofthecurveactually
dropsfaster
the
furtherout
yougo.It’sinvisibleonthechartbecausethelinefurtherthan3SDoutissquishedverycloseto0.Theheightofthecurveat1SDis4.5timeshigherthanthatat2SD.Thecurveat5SDis250timeshigherthanthatat6SDanditkeepsgettingsteeperandsteeper.如果我們直觀地看一下這條熟悉的鐘形曲線(xiàn),看起來(lái)曲線(xiàn)兩端在距離中心最初的兩三個(gè)標(biāo)準(zhǔn)差內(nèi)下降得非???,而在之后更遠(yuǎn)的距離上就會(huì)在零附近以一種接近水平的方式緩慢下降。而這實(shí)際上會(huì)造成巨大的誤導(dǎo):事實(shí)上,距離中心越遠(yuǎn),曲線(xiàn)的相對(duì)高度下降的速度越快。但由于在3個(gè)標(biāo)準(zhǔn)差之外,曲線(xiàn)被壓縮到了非常接近0的高度,所以在圖上我們看不到。曲線(xiàn)上1標(biāo)準(zhǔn)差處的高度是2標(biāo)準(zhǔn)差處的4.5倍,而5標(biāo)準(zhǔn)差處的高度則是6標(biāo)準(zhǔn)差處的250倍,而隨著離中心越來(lái)越遠(yuǎn),曲線(xiàn)的陡峭程度還在不斷上升。ThebestmalesoccerplayerinChina(ZhengZhi?)isalmostliterallyoneinabillion,whichmeansthathe’salmost6standarddeviationbetterthantheaverageChinese.IfthepopulationofChina
doubled
(they’reworkingonit!),therewouldbe2playersasgoodasZhengis.However,ifthepopulationofChinabecamejustonestandarddeviationbetteratsoccer,therewouldbeover200playersatleastasgood,andafewdozenwhoaremuchbetter.中國(guó)最好的男性球員(是鄭智嗎?)在中國(guó)差不多是十億里挑一了,這意味著他的水平比中國(guó)人的平均足球水平要高6個(gè)標(biāo)準(zhǔn)差。如果中國(guó)的人口增加一倍(他們的確在努力這么干?。?,那么中國(guó)將會(huì)出現(xiàn)兩個(gè)和鄭智一樣優(yōu)秀的球員。然而,如果中國(guó)人的平均足球水平能夠提高一個(gè)標(biāo)準(zhǔn)差的話(huà),那么中國(guó)就會(huì)有超過(guò)200名球員和鄭智水平一樣高了,而且還會(huì)有幾十名球員的水平比他高得多。Itcouldbethatanormallydistributedsoccerskillmodeliswhollywrong,butitdoesseemtoexplainsomeofwhatweseeinreality.Foranythingthat’sdistributedroughlylikeabellcurve,thequalityofthe
best
peopleinalargeenoughgroup(likeacountry)dependsmuchmoreonsmalldifferencesinthe
average
levelthanonlargedifferencesin
total
population.Hey,Iwonderifthat’swhysomanyNobelprizewinnersare…*getsrepeatedlyelectrocuted*實(shí)際上這個(gè)正態(tài)分布的足球水平模型可能是完全錯(cuò)誤的,但是它看起來(lái)的確解釋了一些我們?cè)诂F(xiàn)實(shí)中觀察到的現(xiàn)象。對(duì)于任何一個(gè)分布接近鐘形曲線(xiàn)的群體,在一個(gè)足夠大的群體(比如一個(gè)國(guó)家)中,水平最高者的能力更多地取決于平均水平上的微小差異,而人口總數(shù)上的巨大差異所發(fā)揮作用則要小得多。嘿,現(xiàn)在我開(kāi)始懷疑這就是為什么如此多的諾貝爾獎(jiǎng)得主都死于觸電的原因了。Whoops,sorryaboutthat.Let’sseethiseffectinactionontheonetraitthatwecanallagreeisclosetonormallydistributedandvariesamongnations:
humanheight.抱歉這個(gè)梗有點(diǎn)欠。讓我們通過(guò)一個(gè)特征來(lái)看看這種效應(yīng)的實(shí)際力量,該特征的近似正態(tài)分布得到了大家認(rèn)可,而且在國(guó)家間存在差異:那就是人的身高。TheaverageIndiandude(sorryfortheandrocentrism,ladies,there’sjustbetterdataonmaleheightsandmalesoccerteams)is165cm(5′5″)andthereareroughly630millionofthem.TheaverageNorwegiandudeis180cm(5′11″)andthereare2.5million.Thestandarddeviationofmaleheightisaround6cmaroundtheworld.Ifheightsweredistributedinaperfectnormalbellcurvewiththoseparameterstheywouldlooklike:印度6.3億成年男性(女士們,抱歉了,這里看起來(lái)似乎有點(diǎn)大男子主義,但有關(guān)男性身高和男子足球隊(duì)的數(shù)據(jù)質(zhì)量的確更好)的平均身高是165厘米(5英尺5英寸)。而挪威250萬(wàn)成年男性的平均身高則是180厘米(5英尺11英寸)。全世界身高的標(biāo)準(zhǔn)差大約是6厘米。如果身高完全服從一個(gè)由這些參數(shù)構(gòu)建的正態(tài)鐘形分布,那么看起來(lái)將會(huì)像下圖這樣:Asweplotthemsidebyside,theIndiancurvecompletelydwarfstheNorwegianone,evenforprettytalldudes.Thereare9Indianswhoareexactly180cm(5′11″)tallforeveryNorwegian.5′11″istall,butnot
super
tall.Thehighermeaneffectonlykicksinfortherealoutliers,solet’szoomtheaboveplotintothe
really
talldudes.當(dāng)我們把整個(gè)分布畫(huà)在一起,印度的曲線(xiàn)看起來(lái)完全壓倒了挪威的曲線(xiàn),即使對(duì)于身高很高的成年男性也是這樣。印度和挪威身高180(5英尺11英寸)厘米的人口數(shù)量比例是9比1。5英尺11英寸算是高了,但并不是非常高。高均值效應(yīng)只有在那些真正的異常值上才會(huì)起作用,那么讓我們將圖上那些真的很高的成年男性所對(duì)應(yīng)的部分放大看看。Here,thepicturereversescompletely.Thereare100timesasmanyNorwegiansabove195cm(6′4″)asthereareIndians.Underanormaldistributionassumption,thetallestIndianat6′7″wouldonlymatchthe1,000thtallestNorwegian.在這里,情況完全顛倒了過(guò)來(lái)。身高超過(guò)195厘米(6英尺4英寸)的成年男性數(shù)量,挪威和印度的比例是100比1。在正態(tài)分布的假設(shè)之下,印度最高的成年男性的身高將是6英尺7英寸,而這個(gè)身高在挪威人中只能排在第1000位。It’simportanttorememberthatanormalbellcurveisaverysimplisticmodel,reallifeismessy,and
DharmendraSinghis8′1″.Eveninsidetherealmofmathematics,anormaldistributionhas
narrowertails
(theheightdropsfasterasyougetawayfromthemean)thanmostotherwidelyuseddistributionsthatlooksortalikeabellcurve(likethe
student’st
orthe
gamma
distributions).Anormalmodelunderestimatesthenumberofoutliersandoverstatestheimportanceofshiftingthemean.我們必須記住的是,正態(tài)分布的鐘形曲線(xiàn)是一種非常簡(jiǎn)化的模型,真實(shí)情況要復(fù)雜得多,實(shí)際上印度最高的男性DharmendraSingh的身高是8英尺1英寸。即使在數(shù)學(xué)王國(guó)中,相比其他大多數(shù)常用的看起來(lái)像鐘形曲線(xiàn)的分布(例如學(xué)生t分布或gamma分布),正態(tài)分布也有著窄得多的尾部(這意味著在遠(yuǎn)離均值時(shí),曲線(xiàn)下降的速度更快)。一個(gè)正態(tài)分布模型會(huì)低估異常值點(diǎn)的數(shù)量,同時(shí)會(huì)高估平均值移動(dòng)的重要性。Withthatsaid,mymainpoints
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 塑料制品的電器化與智能化發(fā)展考核試卷
- 《洋娃娃和小熊跳舞》課件
- 蘇州科技大學(xué)天平學(xué)院《貨物學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷
- 數(shù)字創(chuàng)意與社交媒體的合作創(chuàng)新考核試卷
- 低溫倉(cāng)儲(chǔ)與冷凍藥品儲(chǔ)存考核試卷
- 2024【事業(yè)單位聘用合同有編制】事業(yè)單位聘用合同協(xié)議范本
- 摩托車(chē)的品牌破產(chǎn)與復(fù)興考核試卷
- 品牌戰(zhàn)略與市場(chǎng)營(yíng)銷(xiāo)規(guī)劃與實(shí)施策略案例考核試卷
- 新材料技術(shù)的研發(fā)進(jìn)展與市場(chǎng)機(jī)會(huì)考核試卷
- Sch-29482-生命科學(xué)試劑-MCE
- GB/T 12239-2008工業(yè)閥門(mén)金屬隔膜閥
- GB/T 10822-2003一般用途織物芯阻燃輸送帶
- 微生物實(shí)驗(yàn)室管理培訓(xùn)考核試題含
- 手機(jī)攝影PPT學(xué)習(xí)課件(攝影的七大要素)
- 換藥,拆線(xiàn)課件
- 生物武器1課件
- 家務(wù)勞動(dòng)我能行-完整版課件
- 部編版二年級(jí)語(yǔ)文上冊(cè)第9課-黃山奇石課件
- 國(guó)開(kāi)電大 管理概論 形考任務(wù)一(畫(huà)組織結(jié)構(gòu)圖)
- 七年級(jí)數(shù)學(xué)上冊(cè)-找規(guī)律
- DB42T1319-2021綠色建筑設(shè)計(jì)與工程驗(yàn)收標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論