兩岸學者共同開發成語與典故知識庫的記憶*

發表於《臺灣華語教學研究Taiwan Journal of Chinese as a Second Language》總第11 期Vol.11 (2015.12):31-44

俞士汶
北京大學計算語言學教育部重點實驗室
朱學鋒
北京大學計算語言學研究所

摘要

  本文介紹臺灣學者羅鳳珠教授主持的國際合作研究計畫「歷代語言知識庫建置」的概貌。主持這個計畫,羅老師演奏了華彩生命的最後樂章。「漢語成語與典故知識庫」是該計畫取得的成果之一,其研製基礎是北京大學計算語言所研製的「漢語成語知識庫」和羅老師建置的「詩詞曲典故資料庫」。本文介紹連接這兩個知識庫以建置「漢語成語與典故知識庫」的技術路線、內容以及應用於成語教學的展示平臺(http://cls.hs.yzu.edu.tw/DLKB/Idiom_Index.aspx)。我們與羅老師在計算語言學與中國古典文學交叉領域的合作已歷時20餘年。在合作中,我們深切地感受到羅老師的博學、勤奮、嚴謹、善良、開朗、堅毅,羅老師的精神及其留下的豐碩研究成果永遠活在我們的心中。

關鍵詞:成語、典故、漢語成語知識庫、詩詞曲典故資料庫、漢語成語與典故知識庫

* 本文撰寫期間得到國家重點基礎研究發展計畫2014CB340504 和國家自然科學基金項目(61272221)等基金專案以及語言能力協同創新中心的資助,謹此致謝。此文曾在第九屆海峽兩岸現代漢語問題學術研討會(2015 年10 月10 日,山東煙台魯東大學)報告。

  

1. 前言:「遍插茱萸少一人」

  本文作者俞士汶與朱學鋒以及北京大學其他數人,多年來和元智大學羅鳳珠教授在學術上密切合作,近年得到蔣經國國際學術交流基金會的資助,共同研究成語和典故的成果有羅鳳珠等(2013)〈分階多語成語典故知識庫教學設計〉,俞士汶等(2013)〈漢語成語及典故知識庫在語文學習中的應用〉以及俞士汶等(2015)〈面向語言能力提升的成語知識庫建構及擴展〉。2015 年夏天,俞士汶接受同年10 月在山東煙台召開的第九屆海峽兩岸現代漢語問題學術研討會主辦單位邀請出席,7 月間希望羅鳳珠老師能繼續一起研究,考慮合寫〈兩岸學者共建成語與典故知識庫的收穫〉,10 月間就能一起到煙台參加研討會,那樣,大家又能密切合作。

  然而,不久就收到羅老師的信件,說一個多月來,因病無法坐起寫論文。接著也收到她幾個月前為周荐編輯《我們一起走過的十年─「海峽兩岸現代漢語問題學術研討會」瑣憶》的一篇回憶散文,題目是〈穿過雲霧迎來朗朗晴空〉。8 月23 日晴天霹靂,我們收到羅老師於8 月22 日逝世的噩耗,不勝悲愴。本來計畫本文作者是三人,突然間,「遍插茱萸少一人」,羅老師安息了。作者剩下兩人,我們再次斟酌,將題目定為〈兩岸學者共同開發成語與典故知識庫的記憶〉。

2. 「分階多語成語典故知識庫」網站概覽

  同羅老師合作研究,取得的最後一項成果是「漢語成語與典故知識庫」。訪問羅老師建置的網站 http://cls.hs.yzu.edu.tw/DLKB/Idiom_Index.aspx (2013 年4 月啟用) , 呈現「分階多語成語典故知識庫」頁面, 選擇分別進入不同語言的版本。在「中文版」的頁面上,可進行成語檢索。在提示「成語:」後的空白處鍵入繁體字的「嫣然一笑」,就可以檢索出一條該成語的簡明信息,請見表1。

表1 http://cls.hs.yzu.edu.tw/DLKB/Idiom_Index.aspx 中「嫣然一笑」的簡明信息
成語台灣讀音
漢語拼音
英文直譯日文慣用句韓文讀音出處朝代出處作者出處文獻
嫣然一笑yan1 ran2
yi1 xiao4
a charming smile (usually of a female) 一笑に付す언연일소春秋戰國‧楚宋玉《登徒子好色賦》

  進一步點擊上表中的「嫣然一笑」,還可以獲取該成語的詳細信息。若不方便輸入繁體字,可借助「索引」功能直接選取要檢索的成語。這個網站可以幫助用戶更深刻地理解成語,因而更準確地運用成語。

  「分階多語成語典故知識庫」網站是兩岸學者共同研製的「漢語成語與典故知識庫」的展示平臺,也體現了羅老師關於分階段循序漸進與多語言對照的成語學習理念。「漢語成語與典故知識庫」是蔣經國國際學術交流基金會支援的「歷代語言知識庫建置計畫」的一項成果。

  這個網站還缺少一些信息,如成語的詳細資訊網頁上的「對應典故」就「尚未開放」,只提供了連接網站,即元智大學的「詩詞曲典故網站」。這個網站還有其他一些「尚未開放」的資訊。「尚未開放」指「漢語成語與典故知識庫」裡已有這些信息,只是網站啟用時尚未校對完(如成語的大陸讀音等),不便把它們放上去,這是羅老師做事的風格,也是留下的遺憾之一。

3. 漢語成語與典故知識庫介紹

3.1 關於「歷代語言知識庫建置計畫」

  「歷代語言知識庫建置計畫」是羅老師生前主持的最後一個國際合作研究項目。長期的學術交流讓她和北京大學計算語言學研究所(以下簡稱計算語言所)的每一位成員都很熟悉。羅老師一直期望同計算語言所的年輕的學術骨幹有實際的深度的合作,於2009 年提出共同申請蔣經國國際學術交流基金的研究計畫。基於對雙方研究基礎和志趣的瞭解,我們建議開展「歷代語言知識庫」的研究。羅老師常年致力於中國古典文學研究與信息技術的結合,在兩岸學術界都有廣泛影響, 其成果集中反映在她所建置的網站「網路展書讀」(http://cls.hs.yzu.edu.tw/)中。計算語言所在自然語言處理領域長期積累的一項成果「綜合型語言知識庫」為以漢語為核心的語言信息處理的原創性研究和應用開發做出了重要貢獻,是現代漢語共時研究的成果,在其基礎上開展語言知識的歷時研究是自然的發展方向之一。我們的建議得到羅老師的贊同,隨即組織團隊,團隊組成,不僅體現了兩岸合作,而且是國際合作。羅老師以「歷代語言知識庫建置」為計畫的題目,撰寫計畫書,向蔣經國國際學術交流基金會提交申請,獲得批准,執行期間為2010 年7 月到2013 年6 月。計畫主持人是羅老師,共同主持人是北京大學王厚峰教授、香港理工大學陸勤教授、日本早稻田大學砂岡和子教授和韓國西江大學姜柄圭博士。在羅老師的主持下,各位成員互助合作,工作井然有序,成果逐步積累。從計畫批准的2010 年起,羅老師每年都召開並主持全體成員的研討會。第3 次研討會於2012 年8 月在北大計算語言所召開。一如既往,總結前兩年的進展,規劃後一年的任務,還特別討論了2013 年結案以後成果發表的有關安排。羅老師忙碌了整整兩天,與會者誰也沒看出羅老師與往年有什麼變化。其實幾個月前羅老師已確診罹患癌症。為了這次會議,她推遲了手術。會議結束後,她才把這個消息告訴了部分同仁,還囑咐大家不必擔心。

  出於對她健康狀況的憂心,我們也曾建議找人替代羅老師計畫主持人的角色,羅老師當即回覆,以她慣用的「蔣基會」縮略代替「蔣經國國際學術交流基金會」,她說:「俞老師和各位老師:謝謝。住院前我已經請教過蔣基會能否由其他老師代理主持一段時間,蔣基會說,因為我們的計畫是從台灣地區提出申請的,代理主持人必須是在台灣地區,所以不能請其他地區的老師暫代。醫師鼓勵我,體力允許範圍內,可以做一點平時做的事。」就這樣,在此後的3 年間,羅老師一直保持著這樣的平靜、樂觀、開朗的心態,在與死神共舞的同時,繼續主持研究,按要求結案,並親自編撰了長達174 頁的成果報告書。「歷代語言知識庫建置計畫」的網站是http://cls.hs.yzu.edu.tw/DLKB/Index.aspx。

  在「歷代語言知識庫建置計畫」的諸多工作中,我們直接參與了「漢語成語與典故知識庫」的研製,與羅老師交互頻繁,獲益良多,記憶猶新。

3.2 「漢語成語與典故知識庫」的基礎

  我們建議開展歷代語言知識庫研究的初衷是期望探討語言演化的脈絡及其同社會環境變遷的關係。對此項研究,計算語言所研製的「漢語成語知識庫」(CIKB)(俞士汶等 2015)和羅老師建置的「詩詞曲典故資料庫」提供了基礎語言資源。

  成語是詞彙中的一類特殊詞語,中國社會科學院語言研究所詞典編輯室編(2005)《現代漢語詞典》(第5 版)解釋為人們長期以來慣用的、簡潔的定型片語或短句。漢語的有些成語含有罕用字或罕用詞,有些必須知道出處、背景故事才能懂得它的確切詞義,因此成語較普通詞語難理解、難掌握,但成語又有言簡意賅、寓意深刻、形象生動、琅琅上口等特點,在現代漢語中使用頻率並不低。面向中文信息處理技術發展的需求,計算語言所研製了漢語成語知識庫。CIKB 實際上是一個關聯式資料庫檔,檔的每個記錄包含一個成語及多種屬性欄位信息。例如,CIKB 中成語「傾國傾城」及其部分屬性欄位列在表2中。

表2 「漢語成語知識庫」中成語「傾國傾城」及其部分屬性欄位
成語變體近義成語反義成語直譯英文出處
傾國傾城傾城傾國國色天香
出水芙蓉
奇醜無比Be extremely beautiful so as to overrun cities and ruin countries東漢‧班固《漢書‧外戚 傳下‧孝武李夫人》:「北方有佳人,絕世而獨立,一顧傾人城,再顧傾人國。」

  CIKB 是建設中的語言知識資源。其雛形見於俞士汶、朱學鋒(2003)《現代漢語語法信息詞典》中的成語庫與慣用語庫。2004 年單獨建庫,2009 年基本成形,目前CIKB 有36,000 多個記錄,其中10,000 多個記錄的各個欄位的信息已經齊全。

  《現代漢語詞典》第303 頁對「典故」的解釋是「詩文裡引用的古書中的故事或詞句」。 典故和成語相同,都是漢語中有出處、有背景的特殊語彙形式。不過,典故與成語也有所區別,成語的詞形基本上是凝固的;典故因多用於韻文,受限於詩詞曲的字數、押韻、平仄等格律要求,詞形不固定。例如,同樣出自《漢書》的典故「傾城傾國」在詩詞作品裡,就有「傾國傾城」、「一顧傾城」、「傾城國」、「傾人城」、「傾人國」、「名花傾國」、「絕代佳人」等多種變化。而作為成語,「傾國傾城」和「傾城傾國」雖互為變體,但沒有其他變化了。因此,典故的辨識、理解與運用比成語更困難。

  相對於成語已有大量的出版物,典故資料顯得稀缺。羅老師看準了學術界的需求,為提升人的語言能力,特別是提升對古典文學作品的鑒賞能力,積多年之努力,從中國古典文學唐詩、宋詞、元曲中收集典故近2 萬條,並發揮跨學科的優勢,研製了詩詞曲典故資料庫,也採用資料庫格式,設有描述典故的「類別」(分語典、事典、語事混合典3 類)、「同義典故」、「相關典故」、「參見典故」、「朝代」、「人物」、「典籍」、「典籍內容節錄」等的屬性信息欄位。羅老師秉承資訊共用的理念,研製之初,便建置了「詩詞曲典故網站」(http://cls.hs.yzu.edu.tw/orig/)(羅鳳珠、蔡宛純 2005)。

3.3 兩個資料庫的連接

  某些成語和典故之間有共同的淵源,字面或意義有某種程度的相似性,將成語知識庫和典故資料庫進行連接,可以實現資訊相互補足,兩個知識庫相得益彰,發揮一加一大於二的作用。由於兩個知識庫又都採用關聯式資料庫檔形式,資料結構相同,連接不僅有必要性,而且提供了電腦輔助實現的便利性。

  成語資料庫和典故資料庫的每個記錄都有一個不變的編號(ID)。連接可有兩種選擇方案。

  第一個方案是保持兩個資料庫不改變。對成語庫中的每個成語提供指向典故庫相關典故的指標(即典故庫中的ID,可以沒有,也可以不止一個);反之,對典故庫中的每個典故也是如此。

  第二個方案是在成語庫中增加相關典故,並吸收、融合其屬性信息,得到一個知識內容更豐富的成語與典故知識庫。當然也可以反過來,以典故庫為基礎,得到典故─成語知識庫。

  無論採用那個方案,需要解決的關鍵問題是計算出成語I 所在的記錄和典故A 所在的記錄(以下簡略為「成語I 和典故A」)之間的相似度。當相似度大於某個設定的閾值δ(0<=δ<=1)時,才在成語I 和典故A 之間建立連接。成語和典故的字形本身自然是相似度的重要因素,成語「傾國傾城」和典故「傾國傾城」字形、字序完全相同,相似度通常最高;成語「傾國傾城」和典故「傾城傾國」的相似度也很高;成語「傾國傾城」和典故「一顧傾城」、「傾城國」、「傾人城」、「傾人國」、「名花傾國」也有不低的相似度;甚至成語「傾國傾城」和典故「絕代佳人」也有一定的相似度,其原因在於它們的字形雖然完全不同,但各自所在記錄的其他欄位仍有重合的成分。典故「絕代佳人」及其部分屬性欄位列在表3 中。

表3 詩詞曲典故資料庫中典故「絕代佳人」及其部分屬性欄位
典故書目作者朝代出處書目內文
絕代佳人《漢書》卷九十七上〈外戚傳‧孝武李夫人〉……延年侍上起舞,歌曰:「北方有佳人,絕世而獨立,一顧傾人城,再顧傾人國。寧不知傾城與傾國,佳人難再得!」……

  從表2 和表3 可以看出,成語「傾國傾城」和典故「絕代佳人」所在記錄中的信息也有重合之處。全面比對成語和典故所在記錄之間有關欄位值的字面、意義、文獻屬性,對不同欄位設定不同的權值,可以綜合性地計算出成語和典故的相似度。在常寶寶博士指導下,白易同學開發了一個實現這個演算法的程式(白易 2011),可以借助電腦輔助實現成語庫和典故庫的連接。對軟體計算出的相似度高的6,000 個對應關係進行人工抽樣檢查,準確率達87.5%。

3.4 成語與典故知識庫的建構及其教學應用

  考慮到成語的詞形穩定,而典故的詞形變化較多,羅老師決定以成語庫為基礎,吸納對應典故的信息,這樣便可以構建完整的「成語與典故知識庫」。不過,即便有電腦輔助,要實現記錄數以萬計的成語資料庫和典故資料庫的全面連接,工作量也過大,在本期「歷代語言知識庫建置」計畫內,只建成了一個小型的樣板庫。在羅老師的主持下,王雷博士首先從北大成語庫中挑選出3,000 多個大陸常用的成語,鄭錦全院士協助羅老師統計了這些成語在臺灣中研院500 萬字平衡語料庫中出現的頻次,砂岡教授、姜柄圭博士分別調研了這些成語在日本、韓國的使用情況。羅老師根據這些資料,精選出2,005 個成語,綜合成語庫與典故庫的信息,並增加對譯的日語欄位和韓語欄位,建成以2,005個成語為登錄項的「成語與典故知識庫」。

  羅老師在建設「成語與典故知識庫」的同時也建立了分階多語成語典故知識庫網站(http://cls.hs.yzu.edu.tw/DLKB/idiom_indexlist.aspx)。這個網站是基於知識共用的理念,還貫徹了羅老師在長期的中國古典文學教學實踐中萌生的多種先進的網路教學策略:多語雙向對應、相似詞查詢、一詞泛讀、延伸文本閱讀、工具書及相關網站查詢(羅鳳珠等 2013)。

3.5 關於一些成語兩岸讀音的差異

  在漢語成語知識庫中有成語讀音欄位,根據字音用軟體自動生成,並參照上文所引的《現代漢語詞典》和李一華、呂德中編(1985)《漢語成語詞典》進行了校對,建設成語與典故知識庫,羅老師又對2,005 個成語增加了臺灣的讀音。經過比對,發現有114 個成語兩岸讀音不同,涉及70 個漢字。這70 個字又分兩類。第1 類有49 個字,它們的臺灣讀音,在《現代漢語詞典》中沒有,如「川流不息」的「息」,臺灣讀音為xí,《現代漢語詞典》只有xī;又如「防微杜漸」的「微」,臺灣讀音為wéi,《現代漢語詞典》只有wēi。第2類有21 個字,它們是破音字,如「車」有兩個音chē 和jū,「安步當車」《現代漢語詞典》讀 ānbùdàngchē,臺灣讀ānbùdāngjū。

4. 記憶中的合作與合作中的記憶

  「歷代語言知識庫建置」計畫是羅老師與我們合作進行的最後一個研究專案,固然記憶猶新,而早期的合作記憶仍歷歷在目。1993 年海峽兩岸中國古籍整理出版現代化技術研討會在北京召開。就在這次會議上第一次見到了當時還算是年輕人的羅鳳珠老師。她用當時在大陸還比較稀罕的筆記型電腦演示多媒體紅樓夢檢索系統,給我們留下深刻印象。1995 年在北京召開的中國古籍整理研究出版現代化國際會議,羅老師對北大計算語言所碩士研究生劉岩斌在大會上的報告《古詩研究的計算機支持環境》極為讚賞。該報告後來以劉岩斌等(1997)出版。交流促成了合作,1996 年計算語言所與羅老師開始了第一次合作,共同研製「宋代名家詩網路檢索系統」。1997 年該系統在美國華盛頓大學(西雅圖)進行了演示,獲得好評。過程與成果都讓雙方感覺合作愉快,獲益匪淺,且建立了互信,此後20 年間雙方的交流與合作從未間斷。

  2003 年夏令在北大,羅老師、鄭錦全院士、北大袁行霈教授和我們在一起交流,產生了召開文學與資訊科技國際研討會的想法。2004 年羅老師便在元智大學成功召開了第一屆,並把接力棒交給北大。第二屆2005 年12 月在北大召開,鄭老師擔任大會主席。11 月初鄭老師與羅老師應南開大學周荐教授之邀請出席「第一屆海峽兩岸現代漢語問題學術研討會」,兩位老師利用這個機會先到北大與我們商定第二屆會議的議程,兩位為會議的成功做出了重要貢獻。就在周荐教授派車來北大接兩位連夜趕赴天津的路上,他們遭遇了一段羅老師稱之為「畢生難忘的驚險經驗」。這個故事記錄在羅鳳珠老師(2015)的佳作〈穿過雲霧迎來朗朗晴空〉中。2014 年,周荐教授邀請羅老師為《我們一起走過的十年—海峽兩岸現代漢語問題學術研討會瑣憶》(周荐、董琨 2015)一書寫一篇文章。〈穿過雲霧迎來朗朗晴空〉便是羅老師的饋贈。我在2014 年9 月14 日便讀到了這篇佳作。羅老師仙逝前後,鄭錦全老師再次把這篇文章發給羅老師的生前友好,可見鄭老師也十分讚賞這篇佳作。我們認為羅老師在重病期間,竟然寫出這樣的文章,實在是難能可貴,不僅立意新穎,文筆流暢,且「穿過雲霧迎來朗朗晴空」的經歷正好反映了羅老師的人生信念,真正是文如其人。

  羅老師珍視生命,從生活中發現情趣,對朋友揮灑真情。在治療過程中,她總是給我們報告好消息。在與癌魔搏鬥的3 年間,羅老師繼續主持歷代語言知識庫建置計畫,直至圓滿結案,親自編撰長達174 頁的成果報告書。可以說這是羅老師生命樂章之最後一章的主旋律。除此之外,羅老師還做了多少事,大概是常人難以想像的。

  2013 年6 月國際中國語言學學會第21 屆年會在臺灣師範大學召開,羅老師借此機會,籌畫了「歷代語言知識庫的建構與應用」專題工作坊,來自大陸、香港、美國、臺灣的10 多位學者於6 月7 日出席了工作坊,第21 屆年會的大會主席鄭錦全院士還親自趕來主持。6 月8 日羅老師又召開了團隊全體成員的第四次工作會議,議題包括成果匯總、以專著形式出版成果的籌畫以及第二期研究計畫的醞釀與組織。連續3 天,羅老師穿梭於桃園與臺北之間,精神飽滿,不見倦容,8 日晚間還陪同我們到陽明山中國文化大學校園高處觀賞臺北夜景,不無風趣地說:「你們幾位來自大陸最高學府,我帶你們到臺北最高學府來看看。」

  儘管每次化療之後都「有一段奄奄一息的日子」,但羅老師挺過之後,又抖擻精神,繼續勞作。2013 年12 月20 日羅老師來信:「十二月又是臺灣學界向國科會提出計畫(研究項目)的時間,我正在寫意象標記及分類的研究計畫,十二月底以前交完稿,交稿後便可接續俞老師寫完論文。」 2012 年9 月已經知曉病情的嚴重性。從2012 年10 月至2014 年2 月這1 年多的時間內,羅老師還與我們合作完成了本文前言所說的3 篇論文且均已在學術期刊上發表。作為第一作者,羅老師是真正的執筆人,即便是第二作者,羅老師也傾注了大量的心血、智慧與知識,然而羅老師在2014 年2 月17 日給聯合作者的信中寫的卻是「計畫結束了,各位老師還是努力研究,一起討論,我好感動。」據我們所知,2013 年、2014 年、2015 年羅老師給漢語詞彙語義學國際會議都提交了論文,不能親自與會,便做好PPT,請人代為報告。我們不知道羅老師在病榻上究竟撰寫了多少文稿,敲了多少字,但我們知道羅老師曾寫道「做研究是我的動力。……後來比較改善,體力稍好,又能工作時,常讓我忘了自己是病人。」

  我們在同羅老師的合作中,還學到了很多中國古典文學的知識,更學到了羅老師一絲不苟的嚴謹學風。我們在合作文章俞士汶等(2013)中引用了成語庫中的例子「嫣然一笑」,其直譯英文原為「(of a woman) to give a charming smile」。我們只以為「嫣然一笑」是描寫女人姿態的,未能發現這樣的直譯有什麼不妥。可羅老師指出:「在詩詞裡,嫣然一笑用來形容花比用來形容人多很多。」經羅老師指教,王雷博士將譯文修改為「a charming smile (usually of a female)」。關於成語兩岸讀音有差異的現象,最初也是羅老師提出來討論的。臺灣使用注音字母,為了便於比對,羅老師將2,005 個成語的注音字母轉換為中文拼音,並將其中讀音有區別的一一挑了出來,再交給北大的老師校對。羅老師一絲不苟的精神實在讓我們感動,可惜羅老師還是沒來得及把北大校對的結果放到分階多語成語典故知識庫網站中。

5. 結語

  在兩岸語言文字交流的潮流裡,羅老師和我們合作,直接進入到中國古典文學與現代資訊技術,特別是自然語言處理技術的交叉與融合。在合作過程中,雙方都感受到彼此對中國古詩詞的熱愛、理解與欣賞,心是相通的,深切感受到兩岸人民對共同的中華文化的認同。羅老師熱愛生活,對動植物也滿懷愛心,每逢過年總記得「問候」我們曾經養過的小貓。她自己種了火龍果,拍了一張火龍果潔白的花的照片給我們,俞士汶請同事張化瑞博士拍了紅火龍果的照片,將兩張照片拼在一起回贈羅老師,並題詩一首:

  曾食火龍果,又賞火龍花;
  紅白兩相異,歸根是一家。

  羅老師說要珍藏這首小詩。20 多年間,羅老師和我們之間不僅學術交流順暢,友誼也可謂根深葉茂。一次我們一同在新加坡開會,有人問起羅老師會後的去向,羅老師脫口就說:「回北京。」語氣如同她自己的家就在北京。

  本文作者應該是三人,文稿還沒完成羅老師就辭世了,我們很不忍,還有很多思念要說,一部分只能放在本文文末的「後記」裡了。

引用文獻

中國社會科學院語言研究所詞典編輯室 編,2005,《現代漢語詞典》(第5版),北京:商務印刷館。

白易,2011,《漢語成語與典故知識庫的自動映射策略與實現》,北京大學本科畢業論文。

李一華、呂德中 編,1985,《漢語成語詞典》,成都:四川辭書出版社。

俞士汶、羅鳯珠、朱學鋒、王雷、常寶寶,2015,〈面向語言能力提升的成語知識庫建構及擴展〉,《西華大學學報(自然科學版)》34.5:1-6。

俞士汶、羅鳳珠、朱學鋒、王雷、常寶寶、砂岡和子、姜柄圭,2013,〈漢語成語及典故知識庫在語文學習中的應用〉,《臺灣華語教學研究》7:13-36。

俞士汶、朱學鋒,2003,《現代漢語語法信息詞典詳解 》(第2 版),北京:清華大學出版社。

劉岩斌、孫欽善、俞士汶,1997,〈古詩研究的計算機支持環境的實現〉,《中文信息學報》1:27-36。

羅鳳珠,2015,〈穿過雲霧迎來朗朗晴空〉,周荐、董琨 主編,《我們一起走過的十年—「海峽兩岸現代漢語問題學術研討會」瑣憶》17-24,北京:商務印書館國際有限公司。

羅鳳珠、砂岡和子、姜柄圭、俞士汶、王雷、常寶寶,2013,〈分階多語成語典故知識庫教學設計〉,《臺灣華語教學研究 》6:1-30。

羅鳳珠、蔡宛純,2005,〈以資源分享的觀點建構數位文史工具書的方法:以蘇軾詩典故網站為例〉,《漢學研究通訊》94:17-29。

後記

  羅鳳珠老師於2012 年因背痛去檢查身體,經過一系列診斷,發現患了胰臟癌。同年9 月11 日羅老師的助理邱筱榆發來電郵: 「各位老師好:羅老師的手術因臨時決定在11 號下午提前動刀,怕各位老師擔心,遲至今日才向各位報告。手術已經結束,目前在病房靜養中,請各位老師放心。若有任何問題需要代為轉達的,可以先寄mail 給我。老師養病的期間,麻煩各位老師多擔待了。謝謝 。」大家都祝願羅老師手術順利,早日康復。可沒料到,20 日羅老師親自來信報告病情:「一、十一日外科開刀手術的結果,因我的胰臟腫瘤與主要的大血管纏繞太緊,無法剝離,醫師判斷若強行剝離會造成大出血死亡,因此只做切片檢查,便縫合傷口。二、切片化驗結果確定我是罹患胰臟癌裡的胰腺癌。三、病況險惡處是與血管纏繞太緊,無法以外科切除手術治療(外科切除手術治療是胰臟癌根治的最好方法)。四、病況安全處是我的癌細胞目前沒有擴散跡象。五、所以我已於二天前從外科病房轉到腫瘤科病房。六、我的腫瘤科主治醫師已經幫我擬定化療治療方案,分三階段進行,第一階段三個月。第一階段化療完成後,若腫瘤能有效與血管剝離,便再次進行外科切除手術,若仍無法分離,便進行第二階段化療加電療的治療。總之,我的病情算是險惡,但仍有機會,醫師要趕在我的癌細胞擴散前進行化療。我開刀的傷口已經癒合,體力也恢復六、七成,所以可能今、明天便開始化療。我在台灣最好的私人醫院長庚醫院治療,…請各位老師放心。」

  2013 年12 月「術中放療」方案提出,15 日羅老師已準備好接受手術,然而醫生評估,風險過大,再次取消手術。18 日她給我們的信這樣說:「暫緩開刀,讓我有撿到一些時間的感覺。現在期待我們新的計畫能順利通過,又能一起合作。我今晚六點開始輸入化療藥劑,現在輸入第三劑,目前為止都還好。現在大概是我這一生最平靜、樂觀、開朗的時候,請大家放心。鳳珠」

  2015 年6 月21 日,醫師已明白告訴她前路不多,她仍給團隊每個成員發來如下電郵:「各位尊敬的老師們好:一直怕各位老師擔心,沒敢直說我的病況。……原希望一一以電話向各位老師致謝,但體力不濟,只好用電子郵件奉上謝忱,失禮之至,還請原諒。有機會在各位老師指導與協助之下做歷代語言知識庫,是我學術生涯最快樂的事,無法完成也是我的遺憾。非常想念各位老師,千般萬般感謝無法細說,怕留下更多遺憾,謹此致上最高謝忱,也請各位老師以我為戒,保重身體。 敬祝 平安健康 鳳珠叩謝」。

  羅老師與惡魔胰腺癌已搏鬥經年,仍念念不忘學術研究,一直在同我們交流、切磋,電郵裡的字裡行間從不見重病患者的苦痛與哀怨。2015 年7 月21日,我們有如下通信:
  俞:「我應邀出席,擬寫一篇論文真希望羅老師能繼續發揮作用。大家都覺得要永遠與羅老師在一起。」
  羅:「論文的事,目前恐怕都使不上力。這一個多月來,我無法坐起,更無法下床,非常抱歉。」
  俞:「千萬不要操心論文的事。重讀你的〈穿過雲霧迎來朗朗晴空〉,對提交魯東大學10 月份會議的論文有了靈感。考慮寫〈兩岸學者共建成語與典故知識庫的收穫〉,與一般學術論文不同,我想增加一些在長期交流合作中,我們從你身上學到了什麼的有關內容。」
  羅:「非常好的構想,我無法參與撰稿,但寫完請寄給我,由彥廷印出來,我便可以看。」彥廷是羅老師的獨生女。
  2015 年7 月22 日,羅老師再次來信:「俞老師,題目的『收穫』二字,若改為『雙贏互惠策略』,可好?彥廷回來幫我處理很多雜事。剛才中醫來看我,說我脈象穩定很多,請代我向團隊成員報告,我繼續努力。」這是我們收到的羅老師的最後一封電郵。

  恰好在羅老師逝世前一個月,她來信仍說:「請代我向團隊成員報告,我繼續努力。」不幸的是,一顆學術之星還是隕落了,年僅六十,令人扼腕歎息!嗚呼!

  

Building the Idiom and Allusion Knowledge Base--Memories of the Joint Efforts by Scholars on Both Sides of the Taiwan Strait

Shiwen Yu
Key Laboratory of Computational
Linguistics (Peking University),
Ministry of Education
Xuefeng Zhu
Institute of Computational Linguistics,
Peking University
Ministry of Education

Abstract

  This paper introduces the outline of an international research project – Building a Diachronic Language Knowledge-Base, which was directed by Prof. Fengju Lo of Yuan Ze University in Taiwan and was also the swan song of Prof. Lo’s colorful life. The Chinese Idiom-Allusion Knowledge Base is one of the achievements of this project. It is based on the Chinese Idiom Knowledge Base developed by the Institute of Computational Linguistics at Peking University and the Allusions Knowledge Base by Prof. Lo. In this paper, we introduce the technical guidelines on connecting the above two knowledge bases to build the Chinese Idiom-Allusion Knowledge Base, its content and its application to idiom teaching on a platform (http://cls.hs.yzu.edu.tw/DLKB/Idiom_Index.aspx). For more than twenty years, we have been working with Prof. Lo in an interdisciplinary field of computational linguistics and Chinese classical literature. Being our longtime and close collaborator, Prof.Lo impressed us deeply with her erudition, diligence, rigorousness, kindness, cheerfulness and perseverance, which, together with her fruitful research achievements, will stay with us forever and ever.

Keywords: Idioms, Allusions, Chinese idiom knowledge base, Allusion knowledge base, Idiom-allusion knowledge base