在網際網路建立漢學研究環境的重要性及可行性 ---- 就中國文學而論

The importance and the feasibility of sinology on Internet * focus on Chinese literature

羅鳳珠.元智工學院通識教學部

漢學研究通訊,八十六年二月,第十六卷第一期

壹、前言:

在科技快速發展的今天,有識之士常為科技背離了人文關懷而憂心忡忡,人文學門也因疏於有效使用科技帶來的方便,使效率受到影響。其中尤以電腦的發明,乃至走向全球資訊網的趨勢,對各學術學門、各行各業,都帶來革命性的改變,人文與科技乖離的問題,便益發突出。

中央研究院負責「史籍自動化計畫」(註一)的謝清俊教授,於〈中央研究院古籍全文資料庫

的發展概要〉(註二)一文〈前言〉明白指出:

自從科技高速發展以來,人文和科技逐漸乖離,在社會中似乎形成了兩個完全陌生且不相往來的團體。在國外,史諾教授一本《兩種文化》(註三)的小書,毫不留情的痛陳此弊,引起了西方世界極大的關切。持續至今,如何調和人文和科技這兩個領域,仍然是西方國家內政上的重要課題。反觀國內,由於我國文化悠久深厚,累積本來豐富,再加上數十年來對科技生吞活剝地急起直追,使得人文和科技的鴻溝遠比西方國家為大。明顯的徵兆是古代文獻離我們日常生活越來越遠。換言之,我們數千年人文的累積竟越來越無助於時下的生活問題。

因此,引用電腦作為漢學研究的工具,以及在電腦資訊網路建構漢學研究環境是目前當務之急。引用電腦輔助漢學研究,最可靠、最明確的使用範圍是借助電腦搜集、整理、分析資料,節省大量的人力,其速度、準確度,搜尋範圍都比人腦快速可靠,且可以節省人力。除此之外,電腦科技及漢學研究者,期待突破的目標是電腦能更接近人類心靈的活動。在此之前,經由文學研究者的主導,建構更適合漢學研究使用的電腦環境,可以使電腦在漢學研究的領域裡,具備更人性化的人工智慧。漢學研究工作者,需要努力的方向便在此。

貳、建立數位化網路研究環境的重要性

一九九六年四月,在夏威夷舉辦的「Association for Asia Studies第四十八次年度國際會議」以〈Sinology by Computer ? 多媒體網路系統在教學上的應用〉為題,討論電腦對漢學研究的重要性及影響。謝清俊教授報告《二十五史》檢索系統;筆者亦有幸應邀與會,報告《全唐詩網路系統》研發過程,及此系統應用於教學與研究的概況,海內外漢學研究學者均對此投以極大的興趣與關懷。

海峽兩岸意識到這股潮流的重要性,也分別舉辦過三次有關古籍整理的學術會議。

一、【海峽兩岸中國古籍整理研究現代化技術研討會】,一九九三年十月,北京,中國中文信息學會、國家古籍整理出版規劃小組辦公室主辦。

二、【中國古籍整理研究出版現代化國際會議】,一九九五年七月,北京,中國中文信息學會、國家古籍整理出版規劃小組辦公室、北京語言學院主辦。

三、【兩岸古籍整理學術研討會】,一九九六年四月,台北,國家圖書館漢學研究中心、全國高校古籍整理研究工作委員會主辦。

三次會議均以古籍整理工作為主要議題,北京主辦的二次會議還特別標出「現代化」、「現代化技術」的主題,並且由中文界與電腦學界合辦,嘗試以電腦作為古籍整理工具的意圖非常明顯。國家圖書館舉辦的會議,雖未標明「現代化」的主旨,但發表的三十五篇論文中,以電腦為古籍整理工具的論文有七篇。北京兩次會議的成果相當豐碩,筆者亦有幸應邀於兩次會議中發表論文,並觀察二次會議的內容。

一九九三年十月,第一次古籍整理研究現代化技術會議在大家抱著【圓夢】的心情下召開,共有二十七篇論文發表,只有:〈談古籍之電子版本,謝清俊〉、〈計算機輔助整理宋代古籍的研究,沈治宏、曾棗莊(四川大學)〉、〈紅樓夢多媒體系統,羅鳳珠〉、〈古典文獻數位化基礎資料處理通則,陳郁夫〉等四篇論文有實際完成的電子系統作為立論的基礎,其他幾乎都是紙上談兵,只知道【該做】,不知道【該怎麼做】。

然而,在一九九五年七月,一年十個月後召開的第二次會議,發表三十五篇論文,二分之一的論文附帶了已完成或完成一半的電子系統,其中更重要的一個特色是大部分由中文界與電腦界做了完美的跨領域結合。

這次會議論文集出版序文中,中國大陸全國高校古籍整理委員會祕書長安平秋教授曾明白指出,中國大陸從一九八四年以來,委託五所大學、五家古籍整理所和一個項目進行試點,結果成效不一。「究其原因,一是研究所的負責人或項目負責人未能自己動手運用電腦嘗試古籍整理,這中間的原因大概主要是他們雖是古籍整理的專家,卻不懂電腦而又沒有決心去學習電腦。」(註四)

北京清華大學計算機系王寧教授從計算機學門的角度,也提出:「採用計算機這種現代化技術手段來整理中國古籍,研究古代漢語和古代漢字,這是一種奇妙的,令人興奮不已的結合,這種結合縮短了古與今的時間距離。由計算機來向現代人提供我們祖先生存與發展的信息,這無異於使現代人向遠古飛升。」(同註四)的看法。

北京語言學院張普教授從應用的層面做了更深入的剖析:「大規模現代漢語語料庫的建立及其語料的標注已經取得了許多寶貴的經驗,這就為近代漢語和古代漢語語料的建立及其標注打開了方便之門,在此基礎上,我們可以進行各個歷史時期的漢語的斷代研究、比較研究、漢語史研究、古漢語理解研究、古漢語CAI教學、文白自動翻譯研究、古文文本的自動分詞、自動校對、古籍版本的輔助校勘等。而古籍版本的電子照排、電子古籍、光盤(光碟)古籍的出版,有關古籍的各種資料在網上的傳播,古籍的自動標引、標注和自由檢索,將使我們可以方便地從古今中外社會科學、自然科學的各種角度去整理、研究,利用浩如煙海的中國古籍,去開掘其中取之不盡的各種寶藏。」(同註四)張普教授在這段文字中說明了古籍數位化後可以利用電子古籍更方便的開拓出新的研究領域。

一九九六年於國家圖書館舉辦的古籍整理會議,提出的論文以傳統方式整理為主,以電腦做為古籍整理工具的論文較少。

海峽二岸整理古籍的工作中,彼岸具有人力資源及典籍資料豐富的絕對優勢,台灣學界很難望其項背。但是,以電腦協助古籍整理的重要性與必然性被認定後,目前可以顯著預見的是台灣學術網路的開放性與普及性,高於大陸學術界,若能掌握現在的優勢,整合中文學界的力量,再與資訊學門跨領域分工合作,必然可以走出新的局面,擴展新的研究領域。當然,如果能建立兩岸合作的管道,截長補短,一來可以避免重複的工作,更可收事半功倍之效。

美國史丹福大學從一九八四年開始一項《Shakespeare Project》,與美國IBM公司合作,把莎士比亞的戲劇製成一套以光碟為主的戲劇教學課程與研究工具,並於一九九四年改版。

美國政府也在一九九四年公佈了一項在國家資訊基礎建設(NII)計畫下的規劃草案:「人文和藝術上資訊高速網路(Humanities and Arts on Information Super Highway : A National Profile)」以國家計畫支持在國際資訊網路作保存與傳播文化的工作。

日前《天下雜誌》指出,國際學術網路正以驚人的速度成長:「據估計,本世紀末前,全球網路使用者將超過兩億人(去年底約三千五百萬人);全球網路上,每四分鐘就增加一個首頁(Home page:利用觀看W.W.W.的軟體,與其他資訊站連接時,第一個呈現的畫面,可做為該站的索引。);全球資訊網(World Wide Web:一種易於使用的網路功能,可將文字、圖片、聲音、影像連結起來,同步呈現。)每兩星期數量成長一倍。而在台灣,資策會預估,到一九九八年網路使用者將突破百萬。(註五)

除了古籍的整理之外,隨著圖書館圖書資料的自動化,圖書館的書目、期刊目錄,已由紙本資料變成電子資料,無紙無牆的圖書館模式已逐漸成形。尋找研究資料時,只需要坐在電腦前,連上網路,輸入所欲尋找資料的關鍵字,便可在十數秒之間找到資料,免去舟車勞頓,翻查卡片之苦,節省大量時間。目前可供中文學界使用的電子資料非常多,如何學會使用線上電子研究論著資料,成為中文學界的研究工作者及中文系學生的重要課題。

參、前人以電子圖書資料作為輔助研究工具之研究成果

電腦科技的發明與國際學術網路的發展,對學術界,乃至各行各業造成的衝擊,已毋庸多言,電腦學術網路深入學術研究工作的趨勢,也不是個人的力量能抵擋的。

謝清俊教授於〈中央研究院古籍全文資料庫的發展概要〉進一步說明:「為了中華文化的延續,務必要使古籍能活出現代風貌,不可任其在科技的洪流中式微沒頂,而解決的方法,則是將古籍以電子媒體表達。」(同註二)也標出了以電子媒體表達古籍的優越性有四項:「一、古籍電子版本可無限制的複製,成為取之不盡,用之不竭的資源,供全民共享。二、四通八達的電腦網路,可使古籍瞬息千里,沒有運輸和分配的問題。三、資料匯集後會產生新的訊息,經相互鉤稽參照,能發前人所未見,對研究工作非常重要。但要匯集大量古籍加以整理研讀,光靠人力幾乎不可能,電子版本卻可以做高速的檢索和種種的應用處理而輕易做到。」(同註二,改寫自原文)其中第三項優點,已得到證實:中央研究院文哲所林玫儀便將之應用於宋詞韻律的分析整理上,得到很好的成果(詳如下述)。

藉著新的工具開闢新的研究方法、研究領域,期使得到新的研究結果,是每個學術研究工作者不斷思考的問題。成功大學王三慶教授曾為文指出:「事實上,研究篇章的撰寫並非永無止境,學問也是層疊累積的結果,如果了無新意的任意發表重複的工作,不過是一種資源的浪費,也徒增學者的負擔而已。因此新資料的出土、新方法的開發以及新的詮釋視角,才可能使學術走向更深更廣的領域,這是學科的進步和學者生命的延續。」(註六)王教授還進一步說明:「目前文學研究方法是今古不分,中西合璧,學者再也不能固守傳統,閉門造車,而是根據研究材料的需要和研究指標的追求,設計和運用其最適當的研究方法。再者,人文學科的領域中,從國內到國外都受到科學掛帥的君臨,處處講究科學指標的計量下,人文走向科學化,文學研究受到科學的洗禮與機器的干預乃是不可避免。」(同註六)

將其他學門的研究方法引進文學的研究,或者引用電腦作為輔助工具的研究,在中文學術的領域中已行之多年,且有一定的成就。與電腦結合的研究,也因為電腦技術的更臻成熟,中文學者在前人累積的基礎上發展,而有後出轉精之效。電腦技術的成熟與多媒體技術、文件交換之標準語言、更多適合中文研究工具的開發、其他學門的衝擊,在在都使得中文學門利用電腦為輔助研究工具的環境與時機更成熟,國際學術網路風起雲湧般的飛騰發展,終於使中文學界無法自絕於這波潮流之外。

今試舉數例說明電腦在中文學界的應用情形,以明其演進的脈絡,並探討以電腦作為中文研究工具的可行性與未來的發展性。

一、應用於紅樓夢方面的研究:

瑞典漢學家高本漢(Bernhard Karlgren)於一九五二年應用數理語言學的研究方法,挑出三十八個字比對,認為前八十回與後四十回作者為同一人。其後趙岡先生於一九七○年以經濟學上數理統計的方法推翻了前者的結論。

然而,高、趙二人都以人工概算,無法得出精確的結果。一九八○年陳炳藻先生在周策縱教授的指導下,嘗試運用電腦從事《紅樓夢》的數理統計,寫成〈從字彙上的統計論《紅樓夢》的作者問題〉,結果證明前後為同一人所寫。因為陳文應用電腦科技,因此在學界引起很多的迴響。隨後有陳大庚先生、李賢平先生也都利用電腦為計算工具,從不同的角度得出不同的結果,得失互見,利弊各有,引來上海師範大學孫遜與孫菊園教授的批評,一場以電腦研究紅學的學術論爭便熱熱鬧鬧的上場。其後江蘇省鎮江市科委彭崑崙先生與南京工學院於一九八七年合作完成了〈《紅樓夢》數據庫系統〉,並據以寫成三篇論文:「1.彭崑崙<關於<<紅樓夢>>時間進程和人物年齡組織的探討--兼論電子計算機在紅學研究中的初步運用>、2.姚頌平<運用電子計算機參與本課題程序編制的幾點說明〉、3.徐小健<關於『<<紅樓夢>>時間進程和人物年齡問題』程序移植和實現漢字顯示的有關說明>」在一九八三南京《紅樓夢》研討會發表。一九九○年廣東深圳大學也開發〈《紅樓夢》多功能檢索系統〉(註七)《紅樓夢》開始有了完整的全文檢索系統,為紅學研究工作者提供了全新的研究工具。

一九八六年哈爾濱國際《紅樓夢》會議,彭崑崙先生及深圳大學又分別提出論文:

  1. 彭崑崙、朱靜華等,〈古代文學研究與現代科學的結合–《紅樓夢》數據庫的開發〉,哈爾濱國際《紅樓夢》研討會,一九八六年六月十三–十八日。
  2. 彭崑崙,〈還「怡紅夜宴」的本來面目–兼論社會科學與自然科學交叉研究的意義〉,哈爾濱國際《紅樓夢》研討會,一九八六年六月十三–十八日。
  3. 深圳大學中文系、電腦中心,〈古典名著《紅樓夢》分專題自動檢索〉,哈爾濱國際《紅樓夢》研討會,一九八六年六月十三–十八日。

一九九四年「與世界對話–甲戌年(一九九四)世界紅學會議」施鐵民先生〈紅學為體電腦為用–從《紅樓夢》的意象談起〉一文,引用文學批評的理論,輔以電腦系統,又開闢一個電腦與文學結合的研究方向。

二、應用於詞學方面的研究:

除了《紅樓夢》的領域之外,近年來以電腦為輔助研究工具,卓然有成的,台灣首推中央研究院文哲所林玫儀教授的〈韻律分析在宋詞研究上之意義〉(註八)。

林教授從事宋詞研究工作二十多年,曾於〈論全宋詞中的若干問題〉(註八)文中述及《全宋詞》(唐圭璋編,北京中華書局出版):「尚有許多問題必須提出討論……一、韻協不合者…;二、破法不同者…;三、分片不同者…;四、錄詞標準有待商榷者…五、調名有誤者…;六、缺詞或缺互見者…;七、互見標準不一者…;八、應作進一步考訂者…」(同註八)以上問題都不小,唐圭璋先生個人窮數十年功力編成二萬一千多闋《全宋詞》,疏漏自是難免。

林教授於文末曰:

《全宋詞》已成為今日研治宋詞最重要之資料。然而其中仍有若干疏漏之處,是以本文站在拾遺補闕之立場,提出修訂意見,使之更臻完備,並為利用此書從事研究工作之學者提供較佳之文本。因為,聲韻學家利用宋詞協韻資料以研究詞韻分部或宋代之語音變化,若根據今本《全宋詞》所標示之韻腳,必不能獲得正確的結論;而文獻學家利用電腦製作「宋詞檢索系統」之時,若是逕據今本鍵入,亦不可能得到圓滿的結果。因此筆者願藉本文,提出二點呼籲:一是全面修訂《全宋詞》…二是詞學研究應走向電腦化:我輩學人幸而生於科技發達之時代,自當應用新觀念、新方法以從事學術之研究,方能突破古人窠臼,為學術研究宏開新局。」(同註八)

林教授建議詞學界應通力合作,「對《全宋詞》進行全面修訂,有正確的本文為底本,製成《全宋詞》全文檢索,能從作者、時代、占籍,以及詞作之詞牌、字數、詞彙、字頻、頁碼等資料,對研究詞學當能提供更大助益。」(同上)林教授並且「開發成另一套檢索系統,除具備宋詞之各項基本資料,諸如作者、詞牌、首句、頁數、字數外,最大特色,是有調式、韻數、韻字、韻法等項目。此外筆者又已將《詞律》、《詞譜》二書之詞牌、例詞、別名、字數、調式、韻字等編製成檢索系統,兩相配合,不但可以查詢《全宋詞》之體式與《詞律》、《詞譜》所收各體之同異,宋詞協韻之方式,二家互見之詞作,各詞牌之別名,甚至任一詞作中,某字曾與何字協韻?乃至於失調名之作品,也可透過此二系統之配合運用,而得以復原。」(同註八)

林教授便依其製作之系統作《全宋詞》韻律分析,得到下列的成果:「一、訂補既有之詞調及體式;二、辨認原已失去之詞調名;三、有助於詞學困惑之解決;四、可校對重篇及和韻之作;五、有助於協韻方式之了解;六、可釐清調名同異之困擾;七、有助於韻部分合之研究。」(註九)文末結語曰:【研究宋詞韻律,除可訂補詞調及體式、辨認失名之詞調、解決詞學疑難、核對重篇及和作、了解協韻方式、研究韻部分合外,尚可發現詞調別名,以釐清詞調名同異之困擾;依據作者曾使用之詞牌,則可研究詞家之創調情形;根據詞作字數、句式、破法、韻數、韻法等資料,則可研究調式之演變。綜合以上研究成果,將可編成最完善之詞調辭典。】(同註九)林文結語所述各項研究,以電腦處理,效率高於人腦數百倍,甚至於可以說人力很難做得周全。

三、應用於語言學方面的研究:

此外,電腦與語言學的結合,產生的「計算語言學」,也成了電腦進入人文領域一個重要的里程碑。北京大學計算機學門與中文系通力合作,在計算語言學方面已卓然有成。主要的研究成果包括自然語言處理、語言信息處理、現代漢語語法電子詞典、自然語言語意分析、機器翻譯、中文輸入中語法分析技術等等,並已出版專書數種。(註十)

四、應用於詩學方面的研究:

北京大學也在這個基礎上,進行「古詩研究的計算機支持環境的設計與實現」的研究(註十一)以陸游詩為對象,將陸游全部詩作九千餘首和部分注釋(採錢仲聯注釋本)共計八十八萬字全部錄入電腦,設計一個具有超文本(Hypertext)閱讀、寫作、檢索、統計功能的系統,應用計算語言學的技術與方法,結合語言學的知識和計算機的技術,進行自然語言的處理;標注詞語、音韻,開展古詩格律研究、古漢語研究、詩人風格研究。「利用系統的統計功能和輔助研究功能,可以對陸詩的文字風格、音韻風格、語言風格以及修辭風格進行定量的評估,也可以得到陸游相對於全宋詩整體或其他詩人的比較結果。」(同註十一,頁三十六)

五、應用於台灣文學研究的預期理想:

台灣文學的蒐集、整理、研究工作被耽誤了數十年,如何結合整體的力量,善用最新的電腦網路科技,選擇能與電腦結合的台文書寫方式,利用電腦軟體及系統設計的技巧,擴展台灣文學閱讀及寫作的人口,兼顧文字與語言的保存、整理。爭取國家計劃的支持,設計全方位、多元化、開放式的網路系統,使之同時具備研究、教學與文化傳承的功能,建立【台灣文學研究網路資料中心】,讓研究與教學工作能雙管齊下,資料的蒐集與傳承能齊頭並進,有迫在眉睫的需要性。(註十二)

肆、結語

電腦是不是能成為帶領中文研究工作突破傳統窠臼的萬靈丹?在電腦還不具備思考功能之前,這個答案顯然是否定的。

電腦的某些特性優於人腦,可以協助從事以人力無法作到的統計工作,但是無法完全取代人在研究中扮演的角色。王三慶先生文末引郭豫適先生的論點,對當時初以電腦作為文學輔助研究工具所引起的問題,有一針見血的批評,值得我們注意與思考,轉引如下:

電子計算機可以容納成千累萬甚至十億、百億個數據信息,可以進行極其龐大複雜的天文數字運算,可以比人工快十萬、幾百萬倍地進行這種運算,這是它的優點。就這方面說,有時候,一百個人、一千個人也抵不過一部電子計算機。但是,電子計算機畢竟是一種人造的機器,它沒有感情和生命,在涉及文學研究中的感情活動和美學欣賞時,它就無能為力了。在這種情況下,一百部、一千部電子計算機也無濟於事。說到底,「機器人」畢竟是一種人造的機器,是人的一種工具。人所造出來的機器,可能會有越來越多的功能和作用,但它需要人來研究、改進、發展和運用。電子計算機是人類科學知識和智慧的產物,它的發展也是以人的科學技術的發展為前提的。億萬年之後,我想情況也還是如此。(同註七)

從一九八五年到一九九六年,經過了十一年,電腦技術的進步早已不可同日而語。尤其是國際學術網路的發展,消彌了空間的距離;數位網路也使圖書儲存的方式從紙本變成數位資料,圖書館成為無紙無牆的虛擬圖書館,對學術研究環境造成重大的衝擊。

十年來,在各方的努力下,電子古籍的建立、研究、發展,也有很好的成果。在古籍原典方面,中央研究院主持開發的二十五史、先秦諸子等資料庫已有數千萬字;海峽兩岸的大學、研究機構、個人所開發的單機版全文檢索系統,已有將近一百種;在國際學術網路上發展的系統也有十數種之多。在期刊論文、學位論文等研究論著資料方面,有單機版的光碟資料庫,也有可在國際網路線上檢索的多種資料庫;各圖書館的圖書資料,也都可以透過網路檢索。學術研究環境已經有重大的改變,各學門的研究工作者,也都充分的享受科技帶來的方便性。

在電腦不具備思考能力之前,在電腦無法涉及文學研究中的感情活動與美學欣賞之前,電腦誠然無法完全取代人腦,人文學界的研究如此,在其他領域的研究上,電腦也只是一個「工具」,研究工作的主導者是「人」。

值得期待的是在數位化網路上建構漢學的研究環境,電腦學界的努力,使技術上已能符合文史學界的需求,文史學界如何與電腦學界結合,使電腦技術能充分為人文研究服務,以消彌科技與人文的疏離隔閡,有賴於二個領域的合作。

十年前文史界與電腦界已有這樣共識:「張仲陶先生強調『不要問電腦能作什麼?而是問你要電腦為你做什麼?』;文史界的學者也強調『文史資料自動化的過程中,不能失去人的主導地位,以及學門的主導地位。』『如何善用電腦的長處,並避免可能帶來的隱憂及弊端。』是文史界的期許。『由文史界負責提出「需要什麼」?由資訊界負責「如何滿足需要」?』」是文史與資訊兩個學門的交集。

新的科技,新的方法,可以開拓新的研究領域,研究方向,這是毋庸置疑的。然而如何使用工具?並且進一步建構新的研究環境,產生新的研究主題,創造新的研究成果,在在都值得漢學研究工作者深思,也需要漢學研究者參與,開創一個有別於傳統的研究方法、研究領域。使用新的工具時如何調整研究方法,讓工具能為從事研究之「人」所用,而不是「人」被工具所限制,甚至於過度依賴、膨脹了新工具的功能,是過程中必須留意的。

附註

註一、史籍自動化計畫是中央研究院史語所與計算中心合作開發之漢文古籍資料庫,該計畫發端於一九八四年,先將歷代正史中的〈食貨志〉輸入電腦,製成資料庫,其後擴大到《二十五史》,現已完成《二十五史》。

註二:謝清俊、林晰,〈中央研究院古籍全文資料庫的發展概要〉,《中國古籍整理研究出版現代化國際會議論文集》,一九九五年七月,北京。

註三:錄自謝文原註:史諾(C.P.SNOW)在一九五九年發表了《The Two Cultures》一書引起世人的注意。之後,在一九六四年增加了一些對外界意見的回響,更版為《The Two Cultures and A Second Look》,目前可得之版本為後者。

註四:安平秋,《中國古籍整理研究出版現代化國際會議論文集》,一九九五年七月,北京。

註五:陳俊仲,〈打開網路藏寶圖〉,《天下雜誌》,一七七期,一九九六年二月一日。

註六:王三慶,〈紅樓夢電腦–《紅樓夢》研究與電腦科技〉,與世界對話–甲戌年(一九九四)世界紅學會議,台灣中央大學,一九九四年三月。

註七:本段文字根據註六論文改寫。王文文末注釋列出高本漢、趙岡.陳鐘毅、陳大康、李賢平、孫遜.孫菊園、郭豫適等人,以電腦研究紅學之相關論文資料。

註八:林玫儀,〈論全宋詞中的若干問題〉,餘不詳。

註九:林玫儀,〈韻律分析在宋詞研究上之意義〉,中央研究院中國文哲研究集刊,第六期,一九九五年三月。

註十:北京已出版的計算語言學相關專書,計有:

《計算語言學引論–計算機理解自然語言的基本方法》,錢鋒著,學林出版社,一九九○年六月。

《自然語言處理》,劉開瑛、郭炳炎編著,科學出版社,一九九一年八月。

《計算語言學研究與應用》,陳力為主編,北京語言學院出版社,一九九三年。

《計算語言學》,俞士汶、朱學鋒編,北京大學計算語言學研究所出版,一九九三年七月。

《人工智能原理》,石純一、黃昌寧、王家欽編著,清華大學出版社,一九九三年十月。

《計算語言學文集》,俞士汶、朱學鋒編,北京大學計算語言學研究所出版,一九九六年八月。

註十一:該研究工作已結成論文:劉岩斌,〈古詩研究的計算機支持環境的設計與實現〉,北京大學碩士論文,指導教授俞士汶,一九九六年一月。

註十二:參見拙作〈牽引台灣文學的藤蔓上網際網路〉,台灣文學與生態環境研討會,一九九六年五月十一、十二日。

附錄:網際網路上文史資源網址及搜尋工具

一、網路文史資源網址:

(一)原著典籍全文檢索資料庫:

  1. 台灣大學佛學研究中心「佛學資料庫國際網路」,內含二百餘部經、律、論佛典原文。網址:http://ccbs.ntu.edu.tw/misc/cbs-exp.htm
  2. 中央研究院全文檢索系統,內含資料庫內容包含二十五史、諸子、十三經、古籍十八種、古籍二十九種、論孟老莊、古漢語文獻語料庫、臺灣方志、文心雕龍、文心雕龍考異及注、佛經三論、新清史-本紀等中文古籍的全文,全部資料超過九千二百萬字。 網址:http://www.sinica.edu.tw/ftms-bin/ftmsw3
  3. 元智工學院「網路展書讀」多媒體網路教學系統,內含詩經、全唐詩、宋代名家詩、唐宋詞、紅樓夢。網址:http://www-crc.yzit.edu.tw/planning/literae/home.htm/

(二)研究論著資料全文檢索系統

  1. 圖書目錄檢索系統,內含國家圖書館資訊網路系統,內含國家圖書館館藏目錄、中華民國期刊論文索引、中華民國博碩士論文索引、中華民國政府公報索引、當代文學史料影像全文系統、當代藝術作家系統、中華民國政府出版品目錄系統、行政院所屬各機關因公出國報告書光碟影像系統。 網址:透過telnet連線查尋,IPaddress為192.83.186.8;透過Web連線查尋URL為http://read.ncl.edu.tw/cgi/m_normal。
  2. OCLC (Online Computer Library Center)系統,為全球最大的圖書館書目網路中心,內含三千萬筆資料。 網址: 透過Web連線查尋,URL為http://jake.prod.oclc.org:3050/html/fs_pswd.htm 透過telnet連線查尋,Domainname為fscat.oclc.org
  3. UnCover系統,內含一萬七千種中英文期刊,四百萬篇以上的目次。 網址:透過Web連線查尋,URL為http://www.carl.org/uncover或 http://www.lib.nthu.edu.tw/services/ref/online/uncover/uncover.htm 透過Telnet連線查尋,Domain name為database.carl.org

(三)原著典籍文字資料庫(只供閱覽,無法檢索)內含「中國詩詞選集」、「中國文學選集」及「佛教經典系列」等古籍全文資料。

中央大學數學系東坡資料庫: 網址: http://www.nchu.edu.tw/buddhism

(四)書影圖像多媒體資料庫

  1. 國家圖書館珍藏古籍特藏選錄: 網址:http://192.83.186.7/oldbook/content.htm/
  2. 中央研究院漢簡圖像資料庫: 網址:http://www.ihp.sinica.edu.tw/database/

(五)其他文史哲網路資源:

  1. 台灣文學與文化,內含台灣文學、台灣文化資料。 網址:http://www.yam.org.tw/
  2. 中文古籍資料網站,有系統的整理中外文史哲研究資料站。 網址:http://140.136.85.1/%7Echen/project.htm
  3. 各種文史哲工具資料使用,內含各種文史哲工具書目錄及使用說明。 網址:http://www.lib.nthu.edu.tw/libs/hslib/four.htm

二、搜尋工具

Internet上的搜尋工具很多,例如:可用來搜尋Anonymous FTP檔案的Archie;可用來搜尋Gopher資訊空間的Veronica;可用來搜尋WWW家頁的GAIS (http://www.edu.tw:8080/) 、Yahoo (http://www.yahoo.com)、Lycos (http://www.lycos.com)、InfoSeek (http://www.infoseek.com) 、OpenText (http://www.opentext.com)、Monster (http://www.nhltc.edu.tw/%7Es8244046) 、Altavista (http://www.gcn.net.tw/hpgame/4/searchl.htm)、蕃薯藤搜尋引擎(http://www.yam.org.tw/)等;可用來搜尋News的Altavistanews、Dejanews;Digital公司的超級大蜘蛛AltaVista(http://altavista.digital.com)。