|
教育部語言文字應(yīng)用研究所馮志偉教授深情懷念桂詩春先生 桂詩春教授是中國著名語言學(xué)家和外語教育家。曾任廣州外國語學(xué)院(現(xiàn)廣東外語外貿(mào)大學(xué))院長,國務(wù)院學(xué)位委員會(huì)外國語言文學(xué)學(xué)科評(píng)議組第二、三屆委員,全國外語教學(xué)研究會(huì)副會(huì)長,全國外語教學(xué)計(jì)算機(jī)輔助教學(xué)委員會(huì)會(huì)長,廣東外語學(xué)會(huì)會(huì)長等。4月21日,我參加了廣外舉行了桂詩春語言學(xué)思想座談會(huì)。深切懷念老朋友桂詩春教授。 我是在上世紀(jì)80年代認(rèn)識(shí)桂詩春教授的,當(dāng)時(shí)我正在研究計(jì)算語言學(xué)的一些新理論和新方法,如詞匯功能語法、鏈語法、遞歸轉(zhuǎn)移網(wǎng)絡(luò)、擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)、左角分析法、樹鄰接語法、CKY算法等,我寫信與桂詩春教授討論一些問題,發(fā)現(xiàn)桂詩春教授對(duì)于這些形式化的計(jì)算語言學(xué)理論非常熟悉。桂詩春教授對(duì)我說,他正在研究實(shí)驗(yàn)心理語言學(xué),試圖通過實(shí)驗(yàn)來驗(yàn)證心理語言學(xué)的結(jié)論,因此,他也關(guān)注到這些形式化的計(jì)算語言學(xué)理論。于是我們通過郵件經(jīng)常討論這些語言學(xué)中的新理論、新方法,積極倡導(dǎo)在語言學(xué)中進(jìn)行跨學(xué)科研究。 桂詩春教授喜歡親自動(dòng)手用計(jì)算機(jī)處理語言,他的動(dòng)手能力很強(qiáng),他經(jīng)常給我介紹他看到的語言自動(dòng)處理的軟件,有時(shí)他把這些軟件收集起來,刻成光盤送給我。他在1991年的《實(shí)驗(yàn)心理語言學(xué)綱要》(湖南教育出版社)中,就有不少關(guān)于自然語言計(jì)算機(jī)形式分析方法的內(nèi)容,我們之間在業(yè)務(wù)上有了很多共同點(diǎn),我們都主張使用計(jì)算機(jī)來進(jìn)行語言研究,這樣,我們都成為了語言學(xué)界兩個(gè)白發(fā)蒼蒼的電腦發(fā)燒友。 在桂詩春教授的鼓勵(lì)和幫助下,我在計(jì)算語言學(xué)領(lǐng)域做了一些有意義的工作,還寫了幾本計(jì)算語言學(xué)的書。桂詩春教授寫的《多視角下的英語詞匯教學(xué)》和我寫的《自然語言處理簡明教程》,都收入了《現(xiàn)代語言學(xué)叢書》,這兩本書都是語言學(xué)跨學(xué)科研究的成果。我非常感謝桂詩春教授對(duì)我的鼓勵(lì)和幫助。 在信息化、智能化的時(shí)代,語言學(xué)與計(jì)算機(jī)科學(xué)、數(shù)學(xué)、心理學(xué)都發(fā)生了密切的聯(lián)系,應(yīng)用跨學(xué)科的方法來研究語言,或者借助于其他學(xué)科的理論和方法來研究語言,已經(jīng)是迫不及待的事情。我們應(yīng)當(dāng)向桂詩春教授學(xué)習(xí),不斷地進(jìn)行更新知識(shí)的再學(xué)習(xí)?!盎畹嚼希瑢W(xué)到老”應(yīng)當(dāng)成為我們治學(xué)的座右銘。 目前,基于多層神經(jīng)網(wǎng)絡(luò)的、以大數(shù)據(jù)作為輸入的深度學(xué)習(xí)方法引入到機(jī)器翻譯中。深度學(xué)習(xí)使用多層神經(jīng)網(wǎng)絡(luò)的方法,重復(fù)利用中間層的計(jì)算單元,減少參數(shù),計(jì)算機(jī)從海量的大數(shù)據(jù)中可以自動(dòng)地產(chǎn)生模型的特征和算法,實(shí)現(xiàn)端對(duì)端的機(jī)器翻譯,而不需要語言學(xué)家的干預(yù)。 2007年以來,采用深度學(xué)習(xí)的方法,以大規(guī)模的雙語對(duì)齊的口語語料庫作為語言知識(shí)的來源,從雙語對(duì)齊的口語語料庫中獲取翻譯知識(shí),統(tǒng)計(jì)機(jī)器翻譯又進(jìn)一步發(fā)展成了神經(jīng)機(jī)器翻譯,口語神經(jīng)機(jī)器翻譯正確率已經(jīng)超過了90%,針對(duì)日??谡Z的神經(jīng)機(jī)器翻譯已經(jīng)可以與人的翻譯媲美了。 由于神經(jīng)機(jī)器翻譯的成功,也有人認(rèn)為語言學(xué)知識(shí)對(duì)于自然語言處理已經(jīng)沒有什么用處了,甚至認(rèn)為翻譯人員就要失業(yè)了。我不贊同這樣的看法。 在神經(jīng)機(jī)器翻譯中,語言之間的翻譯細(xì)節(jié)還是一個(gè)“黑箱”,盡管翻譯的結(jié)果還可以,但是我們對(duì)于其中的語言處理機(jī)制和因果關(guān)系仍然是不清楚的,這需要我們?cè)谡Z言學(xué)上做出科學(xué)的解釋。如果我們使用語言學(xué)的理論來研究神經(jīng)機(jī)器翻譯這個(gè)黑箱,在深度學(xué)習(xí)的算法中導(dǎo)入語言結(jié)構(gòu)的知識(shí),也許就能夠揭開這個(gè)黑箱的神秘面紗。 自然語言處理就像一棵枝葉茂密的果樹,果樹上下掛滿了累累的果實(shí),現(xiàn)在有些急功近利的人出于實(shí)用的需求,都在爭相摘取那些低枝頭的果實(shí),那么,如果低枝頭的果實(shí)都被摘完之后,誰去摘取那些處于果樹的高枝頭上的果實(shí)呢?究竟怎樣去摘取呢?由于自然語言處理的研究對(duì)象是語言,當(dāng)然應(yīng)當(dāng)有語言學(xué)知識(shí)的支持,因此,要想摘取高枝頭上的果實(shí),除了依靠計(jì)算機(jī)技術(shù)之外,我們還需要依靠語言學(xué)知識(shí)去摘取。語言學(xué)家在自然語言處理中是大有可為的。我們要認(rèn)真地學(xué)習(xí)語言學(xué)的知識(shí),深入研究語言學(xué)中的各種規(guī)律和規(guī)則。 同時(shí)還要與時(shí)俱進(jìn),像桂詩春教授那樣進(jìn)行更新知識(shí)的再學(xué)習(xí),除了學(xué)習(xí)語言學(xué)的各種新知識(shí)之外,還要學(xué)習(xí)數(shù)學(xué)、計(jì)算機(jī)科學(xué),特別是要學(xué)習(xí)現(xiàn)代神經(jīng)網(wǎng)絡(luò)的各種理論和技術(shù),學(xué)習(xí)跨學(xué)科的各種知識(shí)和技能,把自己培養(yǎng)成文理兼通、博學(xué)多才的人,才有可能摘取高枝頭上的果實(shí),成為信息化、智能化時(shí)代的新型語言學(xué)家。 |
|
|