|
發(fā)表者:吳軍,Google 研究員
[注:一直關(guān)注數(shù)學(xué)之美系列的讀者可能已經(jīng)發(fā)現(xiàn),我們對任何問題總是在找相應(yīng)的準確的數(shù)學(xué)模型。為了說明模型的重要性,今年七月份我在 Google 中國內(nèi)部講課時用了整整一堂課來講這個問題,下面的內(nèi)容是我講座的摘要。] 在包括哥白尼、伽利略和牛頓在內(nèi)的所有天文學(xué)家中,我最佩服的是地心說的提出者托勒密。雖然天文學(xué)起源于古埃及,并且在古巴比倫時,人們就觀測到了五大行星(金、木、水、火、土)運行的軌跡,以及行星在近日點運動比遠日點快。(下圖是在地球上看到的金星的軌跡,看過達芬奇密碼的讀者知道金星大約每四年在天上畫一個五角星。) ![]() 但是真正創(chuàng)立了天文學(xué),并且計算出諸多天體運行軌跡的是兩千年前古羅馬時代的托勒密。雖然今天我們可能會嘲笑托勒密犯的簡單的錯誤,但是真正了解托勒密貢獻的人都會對他肅然起敬。托勒密發(fā)明了球坐標,定義了包括赤道和零度經(jīng)線在內(nèi)的經(jīng)緯線,他提出了黃道,還發(fā)明了弧度制。 當然,他最大也是最有爭議的發(fā)明是地心說。雖然我們知道地球是圍繞太陽運動的,但是在當時,從人們的觀測出發(fā),很容易得到地球是宇宙中心的結(jié)論。從地球上看,行星的運動軌跡是不規(guī)則的,托勒密的偉大之處是用四十個小圓套大圓的方法,精確地計算出了所有行星運動的軌跡。(托勒密繼承了畢達格拉斯的一些思想,他也認為圓是最完美的幾何圖形。)托勒密模型的精度之高,讓以后所有的科學(xué)家驚嘆不已。即使今天,我們在計算機的幫助下,也很難解出四十個套在一起的圓的方程。每每想到這里,我都由衷地佩服托勒密。一千五百年來,人們根據(jù)他的計算決定農(nóng)時。但是,經(jīng)過了一千五百年,托勒密對太陽運動的累積誤差,還是差出了一星期。 ![]() 地心說的示意圖,我國天文學(xué)家張衡的渾天地動說其實就是地心說。 糾正地心說錯誤不是靠在托勒密四十個圓的模型上再多套上幾個圓,而是進一步探索真理。哥白尼發(fā)現(xiàn),如果以太陽為中心來描述星體的運行,只需要 8-10 個圓,就能計算出一個行星的運動軌跡,他提出了日心說。很遺憾的事,哥白尼正確的假設(shè)并沒有得到比托勒密更好的結(jié)果,哥白尼的模型的誤差比托勒密地要大不少。這是教會和當時人們認為哥白尼的學(xué)說是邪說的一個原因,所以日心說要想讓人心服口服地接受,就得更準確地描述行星運動。 完成這一使命的是開普勒。開普勒在所有一流的天文學(xué)家中,資質(zhì)較差,一生中犯了無數(shù)低級的錯誤。但是他有兩條別人沒有的東西,從他的老師第谷手中繼承的大量的、在當時最精確的觀測數(shù)據(jù),以及運氣。開普勒很幸運地發(fā)現(xiàn)了行星圍繞太陽運轉(zhuǎn)的軌道實際是橢圓形的,這樣不需要用多個小圓套大圓,而只要用一個橢圓就能將星體運動規(guī)律描述清楚了。只是開普勒的知識和水平不足以解釋為什么行星的軌道是橢圓形的。最后是偉大的科學(xué)家牛頓用萬有引力解釋了這個問題。 故事到這里似乎可以結(jié)束了。但是,許多年后,又有了個小的波瀾。天文學(xué)家們發(fā)現(xiàn),天王星的實際軌跡和用橢圓模型算出來的不太符合。當然,偷懶的辦法是接著用小圓套大圓的方法修正,但是一些嚴肅的科學(xué)家在努力尋找真正的原因。英國的亞當斯和法國的維內(nèi)爾(Verrier)獨立地發(fā)現(xiàn)了吸引天王星偏離軌道的海王星。 講座結(jié)束前,我和 Google 中國的工程師們一同總結(jié)了這么幾個結(jié)論: 1. 一個正確的數(shù)學(xué)模型應(yīng)當在形式上是簡單的。(托勒密的模型顯然太復(fù)雜。) 2. 一個正確的模型在它開始的時候可能還不如一個精雕細琢過的錯誤的模型來的準確,但是,如果我們認定大方向是對的,就應(yīng)該堅持下去。(日心說開始并沒有地心說準確。) 3. 大量準確的數(shù)據(jù)對研發(fā)很重要。 4. 正確的模型也可能受噪音干擾,而顯得不準確;這時我們不應(yīng)該用一種湊合的修正方法來彌補它,而是要找到噪音的根源,這也許能通往重大發(fā)現(xiàn)。 在網(wǎng)絡(luò)搜索的研發(fā)中,我們在前面提到的單文本詞頻/逆文本頻率指數(shù)(TF/IDF) 和網(wǎng)頁排名(page rank)都相當于是網(wǎng)絡(luò)搜索中的“橢圓模型”,它們都很簡單易懂。 |
|
|
來自: 素行 > 《數(shù)學(xué)之美》