电竞比分网-中国电竞赛事及体育赛事平台

分享

【委員觀點】愛犯錯的智能體 – 視覺篇(六):外國的月亮比較圓?

 親斤彳正禾呈 2019-04-13

還有幾天就是中秋佳節(jié)了,和家人一起一邊賞月,一邊吃著五仁月餅 ,真是其樂融融。賞月的時候,有時會禁不住想起這句“外國的月亮比較圓”,然后會引申出各種崇洋媚外的批判感悟。


到底有沒有比較圓呢? 2015年9月28日中秋節(jié),廣東天文學(xué)會就指出,當(dāng)年那天的中秋月會與超級月亮和月全食相連,會出現(xiàn)平均九年一次的最大最圓的中秋月。不過遺憾的是,只有南美洲、北美洲東部和非洲西部能看到月全食和欣賞到最大紅月亮,而中國則無法看到。那一天,外國的月亮又圓又大。


但在多數(shù)情況下,月亮到地球的距離從不同地點來看差異不大,不管是用經(jīng)緯儀還是拍照后測量,月亮的大小除了輕微的物理變化外,相差無幾。視覺上產(chǎn)生這種感覺只是心理作崇而已。


雖然“外國的月亮比較圓”并不成立,但在月升月落之間,人對月亮大小的心理感知確實存在差異。最明顯的例子是,月亮在地平線上的大小會比在天上看上去會更大一些,俗稱“月亮錯覺”(Moon Illusion)。 雖然這并非真正的月亮大小問題,但這種心理感受的大小差異卻仍是一個未解之謎。


追蹤下文獻不難發(fā)現(xiàn),感受過、研究過“月球錯覺”的人還真不少。對國人來說,曾記錄過這一感受的首推哲學(xué)家王陽明。他在1484年12歲的時候?qū)戇^一首很有名的小詩,《蔽月山房》。這首詩就記錄了他對月亮錯覺的感受。

山近月遠覺月小,

便道此山大于月。

若有人眼大如天,

當(dāng)見山高月更闊。


而國外則對這一現(xiàn)象有著非常長期的分析和思考。最早可以追溯到古代的公元前4世紀(jì)。希臘著名哲學(xué)家亞里斯多德就記錄過,他認為“月亮在地平線比天上大”的原因是因為地球的大氣起到了放大的作用,導(dǎo)致了人眼產(chǎn)生了感知錯覺。


最早基于距離理論的解釋是Cleomedes在大約公元200年時提出的。他認為地平線上的月亮大是因為其看上去顯得更遠。原因在于在地平線的角度上,人會參照其它物體的大小來感受月亮的大小。而在天頂時,沒有其它參照物可以借用,于是感覺上就會覺得天上的月亮離地球要近一些,因而會覺得比地平線的月亮更小。


1813年,Schopenhauer認為這種錯覺是大腦的行為而非光學(xué)原因。他認為大腦對于水平角度的目標(biāo)判定,直覺的感受理解就比垂直方向的顯得更遙遠,因而看起來更大。


1962年兩位科學(xué)家Kaufman和Rock進行了一個關(guān)鍵的實驗,驗證了月亮錯覺模式與距離之間的關(guān)系,稱為“龐鄒錯覺”(Ponzo illusion),如圖1所示。從圖上可以看出,當(dāng)目標(biāo)具有相同大小,但放在更遠處時,隨著視角的變窄或靠近消逝點,遠處的目標(biāo)會顯得更大。舉例來說,如果將兩個相同大小的蘋果分別放置在5米和10米的位置,后者的視角將比前者小一倍,但感覺上不會覺得后者的尺寸小一倍,而會是相同大小。相反,如果更遠的目標(biāo)與近的目標(biāo)具有相同的視角,則視覺上會感覺有兩倍的大小。


另一種解釋是相對尺寸假設(shè),如圖1所示。月亮在地平線時,其鄰近的目標(biāo)往往能展示更精致的細節(jié),使得月亮看上去顯得更大。反而,天頂?shù)臅蠓秶盏目臻g包圍著,因為顯得更小。這個效果又被稱為'艾賓浩斯錯覺(Ebbinghaus illusion)'。


基于這樣的感覺,有些科學(xué)家認為“地平線上的月亮看上去大是因為其感受的視角尺寸或物理尺寸更大,或兩者均有”。


然而,基于距離理論的不足在于,盡管大多數(shù)人會認為地平線上的月亮既大又比天頂?shù)脑铝两?,大約還有5%的人會覺得地平線上的月亮既大又遠,還有一些人認為距離相同但地平線上的更大,還有一些人完全沒有月亮錯覺。

圖1 左:月亮錯覺;右:艾賓浩斯錯覺


為了探尋真諦,Hershenson在1989年主編了一本書,《月球錯覺的神秘》。該書竟然用24章288頁,詳細介紹了不同錯覺研究者從不同角度給出的解釋。然并卵,沒有達成一致結(jié)論,也沒有終結(jié)對月亮視覺大小差異的疑問。

2、人工智能中的透視問題

如果把月亮大小的感覺看成是與心理因素相關(guān)的透視問題,那么需要說明的是,這種心理原因?qū)е碌耐敢曞e覺目前還沒有什么好的理論和算法去量化成計算機程序并實現(xiàn)。但在客觀存在的透視問題上,研究就多多了,因為客觀的透視在很多計算機視覺、圖像處理領(lǐng)域的實際應(yīng)用中都有著重要的作用,而這些應(yīng)用又直接影響了人工智能的相關(guān)研究。


比如人群計數(shù)研究。人群數(shù)量否準(zhǔn)確預(yù)測,對于安防、旅游景點和地鐵應(yīng)急疏散、商場商品的位置擺放等都有著關(guān)鍵的作用。但要想有效估計人群數(shù)量,又并非容易的事情。用手機來監(jiān)控的話,GPS定位信息的漂移現(xiàn)象往往會顯著影響計數(shù)性能。尤其在開放環(huán)境下如外灘的人群計數(shù),周邊辦公大樓的信號都可能不期而至導(dǎo)致誤估。而場館內(nèi)則會出現(xiàn)GPS信號丟失的問題。有人也嘗試過用無線路由器的信號來監(jiān)控館內(nèi)人群,但精度上無法保證。更合理的方式是通過攝像機來獲取圖像,并對圖像或視頻中的人群進行計數(shù)。不過,攝像頭的角度設(shè)置是有講究的。垂直角度如無人機,可避免人與人的遮擋,但電池的待機時間存在問題,而燒燃油的又不是一般部門能玩的且噪聲巨大;近景的如安裝在公交車站上車處的,則會因為前面的人在視頻中占的比例太大,導(dǎo)致視頻范圍內(nèi)可以計數(shù)的人變得很少,實用價值降低。中等角度如安置在樓宇屋頂?shù)模捎^察的角度相對來說更好些, 適合于較稠密的人群計數(shù)。但由于攝像機的角度問題,遠近人群在圖像中的比例會因透視而發(fā)生改變,如果不進行透視角糾正,則可能會影響隨后的計數(shù)性能。這是客觀透視的一個應(yīng)用。

圖2  人群計數(shù)中的透視問題 [2,3]


另外,在交通領(lǐng)域,大貨車的側(cè)方盲區(qū)和尾部一直是馬路致死率很高的問題。為減少它的影響,一些國家要求強制在兩側(cè)安裝有廣角鏡,比較先進點的還能把盲區(qū)的視頻信息返送到駕駛室內(nèi)。但由于廣角鏡透視變形的原因,駕駛員容易對行人和非機動車駕駛員離車輛的遠近、運動速度產(chǎn)生誤判。此時,就需要有相應(yīng)的算法來幫助還原真實的距離和運動速度了,以減少不必要的風(fēng)險。


除此以外,在計算機視覺領(lǐng)域還有人研究基于圖像的測距問題。這一問題在智能手機流行后似乎研究意義更大了。科學(xué)家們希望能對給定的圖像或視頻,不依賴于真實的測量儀如米尺,就能直接測量出圖中的目標(biāo)尺寸和目標(biāo)間的相互距離。這一研究,顯然也涉及到透視關(guān)系以及透視意義下的比例問題求解。

圖3  基于圖像的測距研究示例[5]


3、透視角度對心境的影響:

情緒、情感對人工智能的研究至關(guān)重要,因為它關(guān)系到是否能真正通過計算機模擬出一個真正像人的機器,而非看上去像。那么,如何形成、在哪里能形成這種情緒、情感就需要仔細思考了。


透視角度的選擇對心境就能表現(xiàn)出很復(fù)雜的影響,尤其在高層語義上。所以,畫家對于透視角度的選擇看得很重,因為它影響了人們評判繪畫的美感。 要讓人工智能像人類一樣能創(chuàng)作,攻破藝術(shù)這個關(guān)口,可能也得好好研究下透視對心境的影響。


我們不妨回顧下人工智能科普奇書《集異之大成》中提到的一位荷蘭畫家莫里茨·科內(nèi)利斯·艾舍爾的創(chuàng)作經(jīng)歷,以及他對透視的運用。

學(xué)畫都是從臨摹開始的。后來,艾舍爾為了能讓自己的繪畫有與眾不同的感受,他對透視角有過非常深的思考。這能從他不同時期的繪畫作品中窺其堂奧。


最初,他喜歡去山頂繪畫,希望得到俯瞰視角下的景色描繪;后來,他改成了從窗戶往外看,窗內(nèi)窗外的透視又形成了一組奇特視角的畫。再后來,他干脆手上拿個水晶球,畫了觀察自己的自畫像。有了自畫像后,他似乎找到了循環(huán),便有了許多自指的杰作。對透視角的不斷深思,最終讓他成為了以“不可能圖形”而聞名的一代名畫家。

圖4 左:窗內(nèi)視角的《靜物和街景》;右:艾舍爾的《手與反射球體》


透視角不僅能影響審美,產(chǎn)生奇妙的美感,它也能制造恐懼。在今年最新上映的韓國恐怖片《昆池巖》,導(dǎo)演別出心裁的采用了“第一”視角的方式拍攝。電影中,六名演員均在胸前安裝了兩個運動相機,一個對著自己臉部,一個對著自己觀測的環(huán)境。由于鏡頭與人臉的距離非常近,對著自己臉部的相機讓演員的臉產(chǎn)生了明顯的拉伸變形。因為變形后的臉與正常臉有明顯的差異,無形中將人的表情尤其是驚悚的表情放大了,使得電影的恐怖感一下就上來了好幾個級別。這是透視角度對人內(nèi)在情緒的影響。因為有點恐怖,圖我就換張大概有點這個意思的給大家感受下好了。

圖5 網(wǎng)紅柴犬瑪魯近景照

所以,透視對人在心理、距離、情緒等方面都有著重要的功能,也有著與人工智能相關(guān)的許多實際應(yīng)用??墒牵忾_透視中的謎團,尤其是主觀透視現(xiàn)象,讓其體現(xiàn)到人工智能的算法中,還是路漫漫其修遠兮。

張軍平

2018年9月20日

參考文獻:

1. 維基百科 

  https://en./wiki/Moon_illusion

2. A.B.Chan, Z.J.Liang, N.Vasconcelos. Privacy preserving crowd monitoring:  counting people without people models or tracking. in:IEEE Conference on Computer Vision and Pattern Recognition,Anchorage, Alaska, USA, 2008.

3. Ben Tan, Junping Zhang, Liang Wang. Semi-Supervised Elastic Net for Pedestrian Counting. Pattern Recognition, vol. 44, issues 10-11, pp. 2297-2304, 2011

4. Ferdinand van der Heijden. Image Based Measurement Systems: Object Recognition and Parameter Estimation. Wiley; 1995.

5. Adrian Roserbrock. Measuring size of objects in an image with OpenCV. Mar 28, 2016 in Image Processing, Tutorials.

6.  侯世達. 哥德爾、艾舍爾、巴赫:集異壁之大成. 商務(wù)出版社,1997.

文章來源:張軍平

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多