牽引台灣文學的藤蔓上全球資訊網

元智工學院通識教學部.羅鳳珠

19965月,台灣文學與生態環境研討會,中正大學




台灣文學的研究工作耽誤了數十年,如何結合整體的力量,善用最新的電腦網路科技,選擇能與電腦結合的台文書寫方式,利用電腦軟體及系統設計的技巧,擴展台灣文學閱讀及寫作的人口,兼顧文字與語言的保存、整理。爭取國家計劃的支持,設計全方位、多元化、開放式的網路系統,使之同時具備研究、教學與文化傳承的功能,建立「台灣文學研究網路資料中心」,讓研究與教學工作能雙管齊下,資料的蒐集與傳承能齊頭並進。

本文將從研究的動機、系統建構的理念與原則、系統設計的架構等方面探討「牽引台灣文學的藤蔓上全球資訊網」的方向。並列出目前可供台文使用的電腦軟體,以及網路現有有關台灣文學、台灣文化方面的相關資訊站。


壹、前言

電腦網際網路這幾年在全球捲起強烈的旋風,使各行各業所向披靡。總統大選時,候選人用來作為宣導政治理念的利器。紙本媒體新聞早在去年使用Gopher界面時期便有時報網路新聞,有線電視台面臨新聞節目競爭壓力,超級電視台率先推出網路新聞,作為公益事業團體的「兒童福利聯盟」,意識到電腦網路的影響力,製作失蹤兒童協尋的節目,很快的協助一位家長找回走失的智障兒。網路上舉凡學術的、政治的、經濟的、休閑的訊息,正如春風吹過江南岸,一片欣欣向榮。

隨著電腦技術的進步,一九九四年Gopher界面只能傳送文字及靜態的圖片,一九九五年MosaicNetscape相繼推出,文字之外,聲音、影像已經可以在網路上來去自如。九六年由昇陽公司開發的程式語言Java登場後,這個以咖啡命名的工具,具有可以跨越不同工作平臺的特性,繼HTML靜態Web文件編輯語言之後,預計將成為動態Web文件的編輯語言標準。各學術領域的人,在網路上摩肩擦踵,開疆闢土,各展所長,建立王國。來自全球的使用者出入其中,各取所需,優游自得,古人臥遊寰宇的夢想,今日在網路上實現了。

台灣文學在這一波潮流中,也紛紛撒土播種,開枝展葉,在網路上呈現盎然生機。依主題大約可以劃分為台灣文學、台灣文化,以及推動台灣文學研究發展的學會、社團、出版社,書訊等。

台灣文學、文化在網路上發展出各具特色的項目(Item),若企圖作為以研究、教學與文化傳承為目的的系統,完整的規劃,適度的整合,選擇恰當的工具,卻是必要的。

大抵而言,民間文學常含有很多歌謠及口述文學,保存語言與保存文字便具有同樣重要的地位。民間文學與民俗風情文化的關係密不可分,民俗風情文化以各種不同的形式展現、例如戲曲、音樂、美術、工藝。因此作為一個可以提供全方位研究、教學、傳承需要的台灣文學系統,除了文字靜態資料之外,多媒體動態資料也是不可或缺的。資料蒐集的範圍,除了原始資料,後人研究資料的蒐集,可以累積研究的成果,也有助於研究工作的綿延發展。

以數位化網路作為系統的承載平臺,主要的著眼點,在於以電腦作為輔助工具時,數位化、開放式、跨平臺界面設計,是二十一世紀電腦網路世界必然的趨勢,一方面可以符合全方位需求的功能,也可以達到將台灣文學散播於網路世界的理想。

本文討論的範圍僅限於面對二十一世紀數位化的電腦網路系統,對於台灣文學的教學、研究、發展與傳承,以電腦作為輔助工具的重要性與可行性。台灣文學的範圍與定義則採用陳萬益教授〈台灣文學系芻議〉文中所言:「……台灣文學的範疇,包括:(一)原住民與漢人的民間文學;(二)明清以來的傳統詩文;(三)日據時期以漢語或日語書寫的新文學;(四)戰後各階段的文學。」為範圍。適用語言及文字僅限於國語、台語、客語。

貳、研究動機

筆者個人對於台灣文學的研究發展涉獵不多,充其量只是一個生於斯長於斯,有中國文學背景,能說台語、客語二種方言,關心台灣文學傳承發展的一份子。卻與大多數人一樣,能用華文寫作,卻不會用方言寫作,能輕鬆閱讀華文作品,要看以方言寫作的台灣文學作品卻倍感痛苦與困難。

寫這篇文章內在的動機,原只是意識到國際學術網路的發達,對學術研究環境造成的衝擊,看到一群熱心將台灣文學、文化的種子散播於網路上的朋友們的努力,單純的想提供一些個人多年來從事中國古典文學網路系統的經驗及心得與大家分享,算是身為台灣子民對於斯土斯民略盡棉薄之力的一點心意。

外在的動機則來自三方面,其一為:以國際資訊網路作為保存與傳播文化工具的工作,美國政府早在一九九四年便展開了:「一九九四年九月,美國政府公佈了一項在國家資訊基礎建設(NII)計劃下的規劃草案:「人文和藝術上資訊高速網路」(Humanitiesand Arts on Information Super Highway : A National Profile)。這草案意圖把美國文化數百年的累積,如手稿、文章、劇本、圖嶼、舞譜、樂譜、錄音、錄影、圖繪、雕塑、畫,和各式各樣的藝品,甚至包括相關的海報、型錄等等,予以數位化,以便日後能放在資訊網路上,不分國界,讓人人都能取用。」(謝清俊,〈當人文、藝術遇到了資訊技術〉)台灣的文化也包含了上列要素,我們何時開始蒐集保存?我們期待誰來保存?我們何時才有這樣一個國家計劃的支持?

其二為:《當代雜誌》一一八期(一九九六年二月份)有一篇〈印第安網路大戰–北美洲原住民利用網路連結五五○個不同族群〉的報導,文中敘述「一個美國工程師唐瑞甫以藍蛇酋長的角色在網路上雕塑出印第安酋長的樣子,在網路上大言不慚的介紹原住民的種種,並褻瀆了原住民神秘的信仰和神聖無比的宗教儀式。藍蛇酋長所傳達的錯誤訊息,擊中了原住民情感最脆弱的要點,同時也擊醒了原住民想要維護自己文化的想法。於是一群原住民組一個原住民網路,在網路上建立一個四通八達的電子博物館,用原住民自己的方式上網路,主事者之一的山卡指出「如果我們不自己介紹自己,而由別人代勞的話,我們原住民的某些東西一定會消失無蹤。」這些原住民深深體會自我認定的危機後,決定站出來利用壓迫者無遠弗屆的網路科技來聯繫分崩離析的五五○個族群,而不是待在壓迫者劃定的保留區中自怨自艾,自生自滅。」(以上節選、改寫自原文)譯者鄭冠榮先生於譯文前言中提出四點他從這本書中思考的問題:「第一點便是後殖民論述中最基本的概念所觸及的被壓迫者如何看待和反擊壓迫者的觀點;其二,就網路這種四通八達,無遠弗屆的工具來看,原住民所堅持的傳統如何確保而不被網路破壞了他們的神聖性;其三,原住民如何去接受操作此種壓迫者所發展出來的工具,進而去介紹原住民的文化傳統?其四,所謂「合格」的原住民,除了由族中耆老主持認定之外,尚有其他的方式來確認原住民身份的純度及其「合法性」嗎?」(引自鄭譯文)

我不厭其煩的引述這些文字,主要的原因是想思考幾個問題:台灣文學在台灣的遭遇,比起北美洲的原住民有何差異?台灣當局與民間力量的結合足夠嗎?我們何時才有「台灣的人文與藝術上資訊高速網路」的計劃?我們的自覺在那裡?我們的團體力量夠牢固嗎?我們腳步邁出的方向一致嗎?

引起我這些思考的另一個原因,是引發我寫這篇論文的第三個外在動機。

清華大學統計學研究所江永進教授於〈選擇台文文字方式e一寡準則〉一文摘要中說:「主要是政治壓制e關係,台文iau無標準化;主要是每人見解無仝e關係,台文寫法e爭論非常紛岐,大概是爭論情緒化e關係,台文標準化e協調困難,親像閣停di文字e爭論頂面,ve記得文字是veh用來寫台文e,這在在攏損害著台文e推展。」(1)江教授舉出目前台文寫法的爭論有四點:「一、漢字ia是拼音字;二、台語特別詞\e寫法;三、veh採用dor一套拼音系統;四、調號標寫e爭論,vehdor一種調號,標本調ia是變調,是mveh標調號。」(同上)江教授依漢字情結、方案標準化難度、電腦問題、教育問題、外來語文問題五個準則,就全漢字、全拼音、漢羅並用三個台文文字書寫方式之優缺點,提出全面的剖析,並極力主張現階段應以漢羅並用的方式書寫台文。

從研究、推廣、教育的觀點及無法逃避必須以電腦作為學術傳播媒體的現實等角度,我非常贊成江教授所提漢羅並用的方案,作為現階段台文書寫的方式,以及江文中的另一個觀點:「對阮來講,是m是最後e台文是全拼音,ia是全漢字,he是咱囝孫e代誌,留hoin去決定,m通隨便siauveh做千秋萬世e代誌,顛倒帶來囝孫e包袱。」從文字及語言演變過程中,自然循序漸進的力量,社會文化的力量,都優於以人力強制訂定的力量,江教授的觀點是更切合實際的。

如果各學派的爭論焦點,情緒的因素大於學術的因素;如果我們沒有把握何時等得到一個國家計劃支持,在現有的環境條件下,選擇一個阻力最小,最容易做得到的方式,掌握現在開放的這一點點空間,搶救逐漸消失的台灣語言、文學、文化,爭取更多的力量加入,以換取更寬廣的發展空間,才是較宏觀而切合實際的作法。江教授為了證明自己的觀點,全文約三萬五千字的論文,全部以漢羅並用的方式書寫。

除了江文之外,清華大學胡萬川教授在台中縣所採集的民間文學客語歌謠部分,也採用漢字拼音輔以註解的方式書寫。

本文擬就江文的觀點進一步說明漢羅並用在現階段的優勢,以及應用在電腦網路上的方便性。漢羅並用的書寫如何與電腦軟體結合?在全漢字與全拼音的主張中間,漢羅並用之外,如何借助電腦軟體使「全漢字的造字問題」、「是否有音就有字的問題」,全拼音的閱讀不便等問題,找到比較好的解決方法,以便進一步嘗試建構一個可供研究、教學、文化傳承為目的的台灣文學網路系統。

參、建構的理念與原則

一、文字書寫方式:以漢羅並用為文字書寫方式,輔以註解以方便閱讀。

全拼音的書寫方式,所引起的閱讀困難,江文已述之甚詳,筆者認為更大的困境是對於一個不懂台語,不懂客語的讀者,如何閱讀全拼音文字?

若以全漢字書寫台灣文學,大多數人都有過這樣的經驗,聽一首詞曲意境優美的台語歌曲時,常會被字幕打出來粗糙的對應漢字弄得索然無味、美感盡失而忍不住扼腕嘆息。或有太多不會讀,不會寫的生難字詞出現,增加閱讀困難。

如果推廣台灣文學的過程中,我們不希望讀者群只侷限在懂得該語言的範圍,漢羅拼音的書寫方式,無疑的是減少閱讀阻力,擴大閱讀群較好的方法。

以漢羅並用作為台灣文學文字書寫的方式,江文已有詳細的說明,但江文並未論及台語之外的客家文學使用客語問題,如何應用在教育與推廣方面的論述也嫌不足。

胡萬川教授主持採集的《石岡鄉客語歌謠》,從出版的集子中,看得到盡可能還原為文字的努力,無確定對應文字者,輔以拼音,再加註解,保留讀音之外,也保留了原意;註解仍無法說明者,保留「存疑」,不妄加猜測,例如:「有妹毋好:有妹毋好嫁石壁坑,堵著緊症tshap一帖藥倒轉來,死到硬釘釘。」(2)註解註明「tshap:照文意應是去抓藥的意思。」不妄下斷言,呈現了更負責的態度。懂客語的人一看便知,不懂客語的人也可以從註解了解文意,也稱得上是漢羅並用的形式。

胡教授於民間故事方面(如:《東勢鎮客語故事集》),採用另一種減少閱讀困難的方法–以漢語改寫。其優點是方便閱讀,讓故事的內涵得以保存,但最大的損失是犧牲了民間口述文學中需以方言才能「傳神」表達的俚語、諺語,以及口述文學時常用擬聲詞表達的情感,犧牲了聲情的表達,只得故事的「形似」,未能「傳神」,犧牲了很多民間文學的「神髓」。

除了江文所舉的論點,我個人贊成漢羅並用,並且輔以註解,以求更完整,理由為:吸引閱讀人口,推廣閱讀層面,以增加教育與推廣的功能。

推展台灣文學的過程中,吸引讀者閱讀,進而教育讀者會寫,是其中不可或缺的要素。我手不能寫我口,我眼不能讀台文,恐怕是很多關心台灣文學的人有過的遺憾。我個人自幼能說台語,閱讀江文時,其中的台語拼音卻讓我的閱讀速度只有閱讀漢字的五分之一。而且中間幾次停頓下來,如果不是為了要寫這篇文章,我不知道單單頂著「關心台文」的帽子,足不足夠支持我讀完他。那麼對於大多數可以有很多選擇的讀者而言,古今中外的文學作品多不勝數,如果他只為了要接觸文學優美情境,每一種文學都有相通的地方,都可以從中得到文學的薰陶,他為什麼要選擇閱讀有困難的符號呢?推廣與研究台灣文學,著眼點除了文學的因素之外,更希望透過台灣文學讓我們的後代子孫了解先民在這塊土地上的生活經驗、思想情感、悲歡喜樂以及辛勤奮鬥所留下來的智慧結晶、文化風貌吧!「讓讀者輕鬆閱讀,容易了解,是吸引讀者的必備條件。

台灣文學面對的困境是語言正在加速的消失之中,若以全拼音記載,我們的下一代還能看懂多少?口語隨著時代與環境變化的問題又怎麼辦?口音有地域差異的問題又如何解決?例如江文中「拿」一詞用了「keh」(頁44),也可以讀為「teh」、「提」,很明顯的是口音的差異問題。

我們要吸引的讀者,是只侷限於懂方言的讀者,使台灣文學成為封閉的文學,最後困死其中呢?還是希望不懂台、客語的讀者也能領受台灣文學之優美,文化內涵之豐富。

大多數接觸過大陸簡體字的人都有這樣的經驗,單獨看筆畫

簡化太多的字時,常常看不懂,若放在文中參照前後文,十之八九便可以明白。漢羅並用的書寫方式,在大多數人都懂漢字的情況下,閱讀漢字的困難很小,困難只存在台語拼音的部分。不懂台語的人可以從前後文去推測文意,推測不出來的看註解,比起全拼音的困難便少多了,而且也可以從這樣的閱讀過程學習台語

漢羅並用的方式同樣適用於客語及其他方言,例如「花蕊」,漢語、台語、客語都相同,以漢羅並用書寫台文時,用「花蕊」二字,大家都可以看懂。需加註解的重要性,除了輔助不懂該語言的讀者了解文字之外,可以保留語言的原貌,記錄語言轉變的痕跡,作為語言學的研究素材,其餘的考慮將於「肆.二」詳述。

除此之外,漢羅並用還具有方便書寫,方便電腦輸入、輸出、交換文件的特性,需以拼音書寫的部分可以建立詞語資料庫,設計詞語檢索、漢台語替換,甚至翻譯系統的功能,作為台文寫作的練習工具,吸引更多參與創作的人口,豐富台文創作的質與量,滿足台文教育的需求。

不強用漢字完全取代台文語言,還有一個理由是考慮文字語言自然演變的因素,及網路上通行之BIG5碼字數的限制因素。造字的代價太大,江文已述及,電腦軟體的進步可以預期,當然也可以預期造字越來越方便的可能性。在單機版系統上造字,只要附上造字檔,問題較易解決。造字檔於網路上傳輸、交換的效益如何,筆者未曾實際實驗,不敢臆測。中研院十年來花費大量經費開發完成的《二十五史》等資料庫達八千多萬字,開發中的資料也有七千多萬字,《二十五史》的造字字數達四千多字,其中必有很多文字可供台文使用,BIG5碼沒有的字,重複造字是否形成浪費?《二十五史》也已經放在W.W.W.網路上(3),造字檔在網路傳輸交換的問題「應已」有了解決的方法。連線進入中研院的Homepage,即可看到各種中文資料庫目錄,只可惜大部分資料都是「限院內使用」,儼然「侯門深似海」。

四月十五日的《資訊傳真週刊》第188期的標題報導上,關於中文內碼有最新的動態,摘錄重要片段如下:「中文內碼終將統一,主計處和研考會決定將在一九九九年全面採用新版UniCode,並將推出一萬七千餘字的BIG-5+碼給BIG-5用戶過渡之用。對於中推會之擴充計畫,研考會,中標局和主計處日前協議,由主計處參考中推會的建議,先定出BIG-5擴充碼:BIG-5+,做為現有系統增字之用。而原有政府系統則暫不變動,待一九九九年後,完全採用統一碼UniCode。」

雖然我們沒有把握可以先等到那一個包含更多漢字的中文內碼可以使用,暫時不要浪費眼前有限的人力去造字的觀點,我與江教授的看法是相同的。

以全拼音保留語音的考慮,可以用逐字或逐詞加註拼音的方式解決大部份的問題,詳如下述。

二、系統承載平臺:以全球資訊網(W.W.W.WORLDWIDEWEB)為承載的平臺

全球資訊網(W.W.W.WORLDWIDEWEB)是歐洲量子物理實驗室所發展出來的多媒體資料查詢系統,提供使用者交叉查詢的方式,可以經由連結(Linker)進行檔案與檔案間的連結,具有高度的整合性,並且支援超文件(Hypertext)和多媒體(Multimedia)的技術,使用者非常容易在全球資訊網上建構多元性、全方位的學術研究環境,也非常容易從中獲得全球網路上的資訊。

以網路作為承載平臺建構網路版教學研究環境,與製作單機版使用的教學光碟,其優缺點如下:

1.製成網路版系統:

優點:

甲.系統安裝、維護、資料更新、修改比較方便。電腦只是工具,不具備思考能力,電腦也不是萬能的,無法取代人的思維活動,作為一個研究教學的輔助工具,如何利用電腦優於人腦的部分,如超強的記憶力、計算能力、儲存檢索資料能力,以減輕人力的負擔,應用系統設計的技巧,設計更接近人性化的系統,是以電腦作為教學研究輔助工具的設計方向。使用者的需求因人、因時、因地(不同學科領域)而有不同,網路上便於修改、更新的特性,可以隨時修正系統設計,以減少與實際使用需求之間的落差。

乙.可以提供線上遠距離教學的功能網路系統可以提供線上遠距離教學的功能,拉近城鄉教育資源的差距,使有限的教材、師資等教育資源,透過網路教學達到資源共享的互補功能,以加速、擴大、落實台灣文學的教育發展。

丙.保持系統的靈活性,資料的新穎性系統的伺服器(Servers)有專人維護、更新,資料更新(Update)的速度高於單機版,可以立即載入最新資料,保持資料的新穎性。

丁.提供使用者更多雙向、主動的參與、主導空間系統設計時可以引用D.I.Y.DoItYourself)的觀念(4),留給使用者更多雙向、主動的參與、主導空間,使系統更落實在以使用者需求為系統設計考量,而不是以管理方便為系統設計考量的觀念。提供使用者主動參與、主導的空間,可以使系統達到更人性化的理想。

戊.跨平臺的界面適合不同的電腦環境系統具有跨平台的功能,這一點非常重要。中國經典作品電子化的歷史已有十年,中國大陸與台灣已完成或陸續開發的資料庫非常多,每一個系統在不同的電腦環境下發展,各自為政,系統互不相容,造成使用上的不便,其結果就是每個人都只能用自己的系統,或者一部電腦只能容納一種系統,形成資源的浪費,也使系統封閉而走向死胡同。

缺點:

網路通行之BIG5中文內碼字數不足、網路著作權取得與認定尚無

明確的法律可供依循,易衍生著作權的困擾。

2.製成單機版光碟:

優點:中文內碼不足的字較容易以造字解決。

缺點:網路版的優點都無法做到。

若須考慮使用者付費的公平原則,網路版系統也有收費的功能,如:美國CarlUncover期刊系統、OCLCFirstSearch系統,都有網路付費的設計。

三、系統使用界面:Netscape為瀏覽器,以Java為程式語言Netscape是目前全球資訊網上最受歡迎的使用界面,可以傳輸文字、聲音、影像。一九九六年JAVA登場,除了保留Netscape的特色外,具有可以跨越不同工作平臺的特性及可以編輯動態文件的功能。惟目前使用JAVA的系統還不多見,但網友們摩拳擦掌,躍躍欲試的氣氛倒是很濃厚。台灣文學的研究教學,無法排除台灣文化而獨立。文學的主要媒介是文字,文化卻還有文字之外的音樂、美術、工藝、圖像、宗教儀式、民俗風情文物等等動態、靜態、有聲、無聲的諸多媒體,選擇可以編輯、傳輸、儲存多媒體的使用界面是必須考慮的。

四、系統設計的方向:兼顧研究、教學與文化傳承的功能掌握最新學術資訊,持續不斷的研究發展是維持良好教學品質的必備條件。將台灣文學的藤蔓牽引上國際學術網路,有文化傳承發揚的重要意義,教學與研究也是達到文化傳承的重要管道,因此除了全面完備的蒐集儲存資料之外,設計一個兼具教學與研究使用的系統,與文化傳承的目的有相輔相成、相得益彰的功效。

五、系統設計的架構:以開放式的網路系統架構為主台灣文學的內容,依形式分類,包含了傳統詩文、民間文學、新詩、小說等;使用語言包含了台語、客語、日語、原住民語言等。全文資料庫勢必也需要做適當的分類,而存有一個以上的全文系統。開放式的系統架構,從設計開發的角度考慮,可以節省系統設計及程式開發的時間。建立開放式的系統架構,系統設計及程式設計者只需針對不同文體類型的特性作小幅度的修改,不必重新開發。筆者認為更重要的著眼點是使用者只需要學會使用其中一個系統,便同時會使用別的系統,以降低學習使用的困難度,減少使用系統的阻力。

肆、系統設計的架構:建立台灣文學研究網路資料中心

一、全文檢索資料庫:

以開放式的架構設計全文檢索系統,除了具有節省系統設計與程式開發時間的優點之外,使用者只要學會使用其中一種系統,就會使用其他系統,減少學習的時間與阻力,降低學習的困難,提高使用的意願,達到推廣的目的。

系統程式的設計應提供同義詞權威檔資料庫,並具有布林檢索、模糊檢索(竄字檢索)、容錯檢索的功能,以符合學術研究的需要及台灣文學的特性。

  1. 權威檔資料庫:

權威檔資料庫對文史典籍文史研究的重要性超過其他學門。選擇關鍵詞的能力及下關鍵詞的涵蓋面、準確度,是學科訓練中非常重要的部分,需要相當的學科素養背景及日積月累的功夫,對於久遊堂奧的人固然問題不大,但對於初登門檻的人卻難免掛一漏萬。例如在一個沒有提供權威檔的系統中,如果要檢索「蘇軾」的相關研究資料,只輸入「蘇軾」一詞作為檢索點,沒有輸入「東坡」,勢必會遺漏很多資料。中研院二十五史檢索系統即因為未提拱權威檔,便成一個缺點,〈中研院史語所漢籍全文資料庫介紹〉文中便有一例:「利用資料庫檢索六朝時代比丘尼的史料,由於當時不稱尼姑,因此鍵入「尼姑」將一無所獲。若鍵入「比丘尼」,卻會因為當時人稱「尼某」而遺漏甚多例子。若鍵入「尼」……卻有不少其實是「仲尼」的資料。」(5)、另一段說:「研究漢魏六朝棄嬰殺嬰的問題,由於當時人不用「棄嬰」、「殺嬰」等語,倘若鍵入,亦將無所得。但若鍵入當時人所用「生子不舉」一詞中的「不舉」,從《史記》查到《隋書》,費時一秒,找到一七六項,一九五詞,其中有許多可能是「見知不舉」、「不舉哀」、「不舉樂」的例子。」(同5),若有權威檔資料庫註明:「比丘尼=尼姑=尼某」、「棄嬰=殺嬰\=不養=勿舉=生子不舉」等資料,讀者只要輸入任一已知的字詞,系統能自動檢查權威檔,將權威檔的資料涵蓋檢索,即可對讀者有一定的協助作用。權威檔的重要性,在詩詞類的韻文中尤其明顯,在民間文學也會因為同一事物,因時代地域不同而名稱有差異,權威檔的需要便更突出。

2.布林檢索的功能

布林檢索的功能是使用者可以用「?AND?」、「?OR?」、「?AND?,NOT?」、「?OR?,NOT?」四種檢索方式檢索資料,以方便做主題研究時資料的蒐集整理。例如上述二十五史的例子中,作者所舉「比丘尼」的例子,便可用布林檢索的功能,輸入:「比丘尼OROR尼某NOT仲尼」即可解決。

3.模糊檢索與容錯檢索

模糊檢索與容錯檢索功能接近,二者對於記憶不完整等不確定資料的檢索有極大的幫助。使用模糊檢索功能時,系統可以容許只輸入確定資料,不確定資料用系統指定的特殊符號取代,一樣可以檢索到所須的資料。容錯檢索除了具有模糊檢索的功能外,還可以設定容許中文的同音異義字的錯誤,例如:「畢竟」誤輸入為「必竟」時仍可檢索,或者是英文字母拼錯時仍可檢索到接近的字。這個功能無論對於以全漢字書寫、以全拼音書寫、或以漢羅並用書寫的台文進行檢索時,都可以提供使用者更大的方便性。

二、內容加工資料:

1.內容註解資料:

民間文學的歌謠與口術文學部分,因為大部分靠口語流傳,記錄成文字後,內容註解的重要性便特別重要。以拼音拼寫部分,如前面所說,需要加註解幫助不懂該語言的人閱讀;以文字書寫部分也因各種因素,需加註解才能保存原意,舉例如下:方言中有些名詞會隨著該物件的消失而消失,就算僥倖保存了語音,也會因為物件消失而使後人不知所云,例如《石岡鄉客語歌謠二》:「〈一送親人空樹下〉:一送親人空樹下,sa(一聲)tsii(四聲)包袱放phet(四聲),你食茶,茶子食phet(四聲)點心到,點心食phet(四聲)當晝下。」(頁一三一)其中「sa(一聲)tsii(四聲)包袱」一詞註解註曰:「sa(一聲)tsii(四聲)包袱:講述者說明以前的人裝東西都用布包一包,sa(一聲)tsii(四聲)則不明其意。」筆者也能背誦這首歌謠,sa(一聲)tsii(四聲)處讀為ㄍㄚ(二聲)ㄐㄧ(四聲),是早期客家人出門時裝東西的手提袋,以藺草編織而成,是當時民間貧苦人家的日常用品,近二十多年來被便宜又耐用的塑膠製品取代,早已不復見。二者的用途相同,如果筆者語音的記憶正確,應是指相同的東西,若不加註解,隨著該物品的消失,後人更無從得知詞意。

民間文學作品加上註解的另一個重要性是可以保留環境變遷的歷史痕跡,例如《石岡鄉客語歌謠一》:「〈羊咩咩〉:羊咩咩,十八歲,坐火車,坐到梅樹下…」(頁三六)只看文字,不知道火車怎會開到「梅樹下」,其實「梅樹下」是東勢線鐵路的一個站名,在石岡與東勢之間,東勢線鐵路是豐原東勢的主要交通路線,現在已拆除。加上註解,後人可以知道「梅樹下」曾經是一個火車站,數十年滄海桑田後,鐵路的痕跡也許蕩然無存,但是這裡曾經有鐵路的事實,便可以在文學作品裡保存下來,得到印證。

2.詞語詞庫資料

整理台文詞語詞庫資料,既有助於語言學及計算機語言學的研究,又可作為台文寫作練習系統、台文翻譯系統。隨著計算機的發展,計算機從早期處理數字,到現在作為研究語言學的工具,對計算機及語言學都是很重要的過程,台灣中央研究院歷史語言研究所及計算機中心都有很多成果;北京大學也成立一個計算語言學研究所,由計算機研究所俞士汶教授與中文研究所語言學家陸儉明教授共同主持,已有專書及博碩士論文出版。台灣文學若從建立詞語資料庫開始,再逐步結合語言學與計算機方面的學者,做台文計算語言學的研究,對台文的研究發展必定能有重要的貢獻。

3.台文寫作練習與自動翻譯系統

將台文的詞語建立詞語資料庫,加註相對應的漢語,可以作一個簡單的台文寫作練習系統,進而擴充為翻譯系統,例如:筆者將江文中以拼音書寫的台文標注意義對等的漢語,拿一段以漢文書寫的文字,以「取代」(Replace)的方式修改,即可變成以台文書寫的文章,中間也許還需要修改潤飾,但至少可以作為寫作的練習工具,等到詞語資料累計到一定的數量,就能改成翻譯系統。

4.標注拼音資料

廈門大學中文系周長楫先生從事上古語及閩南語聲韻的研究工作有很好的成果,他認為:「漢語各方言都有文白讀音的現象」(6)「閩南語的文音即文讀音,也叫讀書音…;白音即白讀音,也叫說話音……」(同6)那麼標注拼音音標時應該以讀書音標注?或以說話音標注?周文進一步提出:「人民覺得用閩南話來誦讀吟唱唐詩,比起用普通話(國語)來誦讀吟唱唐詩,在音韻格律方面,更能表現出唐詩音韻格律的音樂美來。」(同6)「如果用閩南話的說話音讀唐詩,則經常會出現不協韻順口,平仄格律有時會跟唐詩平仄格律乖戾的現象。」(同6)。因此若要將台灣文學中明清以來的傳統詩文部分標注讀音時,標注讀書音應該是比較正確的方法,其他文體應該標注讀書音或說話音,有待專家認定。但是無論標注何種音,將台灣文學資料以拼音符號標上語音,卻可以達到保留語音的功能。也能讓不認得漢文,能說台灣話或客家話的外國人,能藉著拼音資料讀台文。目前台語拼音系統有很多種,客語拼音方式也還未完全明朗,標注拼音時選擇那一套拼音,有很多見仁見智的看法,這是正常的現象,如果勉強訂一個標準,反而扭曲扼殺了語言自然演變的本質,不如以兼容並列的方式,隨著自然情況演變。在網路上標注拼音,因為萬維網路具有支持超文件(Hypertext)的特性,正好可以達到兼容並蓄的要求。標注拼音時,以較多人使用的標準標注,不同系統差異的部分,以超文件連結,這個作法有另一個好處是,也可以容納地方性口音的差異。例如:「拿」,有些人讀「keh」,有些人讀「teh」,這是口音的差異。「讓有心的人」的「讓」,有些標注「ho」,有些標注「hou」,這是拼音標注的差異。超文件功能可以讓二個以上讀音部分以不同顏色顯示,使用者即可知道內含不同讀音,可以進一步選擇、判斷。文字部分有異文時,也可以用同樣的方式處理。一來達到兼容並蓄的效果,再者異文異音的標注,也可以讓研究者方便比對。

5.語音有聲資料庫

全球資訊網及NetscapeJava界面都具有承載、傳輸聲音的功能,所以若能將台灣文學全文資料庫全部加上語音有聲資料,使之具備如語言學習機的功能,對語言的教學就有很大的幫助,而且這些軟體也都具有與語言學習機相同的功能。事實上現在的「快譯通」等電子字典就是以此原理設計。在電腦網路上可以預期的優勢是將聲音在電腦上存取,在不久的將來,可以跟錄放音機一樣方便。

北京師範大學在這方面已有一些成果,該成果發表於一九九五年七月中國古籍整理研究出版現代化國際會議,周曉文、李國英〈「古代漢語」計算機教學輔助系統軟件(GDY軟件)的設計與研制〉,該軟件便具有語音的功能,北師大開發這一套系統的目的是提供外籍學生學習中文練習讀音之用。

6.詩文押韻資料

台灣文學的範圍,有一部分是「明清以來的傳統詩文」,台灣傳統詩文的押韻規則與唐宋詩的押韻規則有何異同?周長楫先生曾將《詩韻》韻部和閩南話讀書音韻部的對應關係整理成〈詩韻常用字閩南話讀音音讀表〉,並且分為二十二個韻部(同6)歷代詩詞韻文的押韻,及音韻的演變,形成聲韻學重要的課題。「明清以來的傳統詩文」既是講究平仄格律的韻文,押韻的規則為何?根據那一種韻書?明清以來的詩文雖產生於台灣,作者必也受過唐宋以來詩文的影響,用韻的情形是否與中國古典詩一脈相承?有那些改變?改變的因素為何?都是值得研究的。以人力標注比對,固然是一個尋找線索的方法,若能以電腦代替人力,準確度與效率都會提高很多。中央研究院文哲所林玫儀教授曾經以電腦作宋詞韻律的分析工作,林教授「將唐圭璋《全宋詞》及孔凡禮《全宋詞補輯》二書所收,共二萬一千三百九十首詞(含存目)之作者、詞牌、字數、調式、韻字等輸入電腦,除供歸納及對比外,尚可依韻法將韻字作系聯,作為詞韻研究之重要資料。」(7)文末結語曰:「研究宋詞韻律,除可訂補詞調及體式、辨認失名之詞調、解決詞學疑難、核對重篇及和作、了解協韻方式、研究韻部分合外,尚可發現詞調別名,以釐清詞調名同異之困擾;依據作者曾使用之詞牌,則可研究詞家之創調情形;根據詞作字數、句式、破法、韻數、韻法等資料,則可研究調式之演變。綜合以上研究成果,將可編成最完善之詞調辭典。」(同7)林文結語所述各項研究,以電腦處理,效率高於人腦數百倍,甚至於可以說人力很難做得周全。

周長楫書中述及以閩南語讀書音讀唐詩,大部分平仄格律與唐詩一致。大部分一致的原因為何?少數不一致的原因又為何?唐詩所用的音韻與閩南語讀書音二者音韻的關係為何?唐詩以閩南語說話音讀,經常出現不協韻?讀書音與說話音如何辨別?有無規律可循?這些問題恐怕都得借助電腦才可能得到全面性、科學性的答案。因此研究明清時期台灣詩文,標注用韻情形,能提供學術上研究的價值,只是依何種韻書標注,恐怕需要這方面的學者審慎評估。

三、相關研究論著資料

將台灣文學研究之所有相關史料、研究論文蒐集起來,在網路上建立一個「台灣文學研究網路資料中心」,讓所有從事台灣文學研究工作的人,只要進入這個資料中心,便可以找到所需的相關研究資料。

四、文化媒體資料庫

除了上述文字資料外,其他靜態、動態媒體資料對於文化的保存,文學的研究,甚至於台灣歷史、政治、經濟的發展,都是非常重要的,應該樣建立一個像美國的「台灣人文與藝術資訊中心」統合其事。

伍、有關台灣文學的電腦軟體工具與網路資源

一、可供台文使用的電腦軟體工具

  1. 鄭良偉,《台語電腦文書處理/輸入法系統》,椰城股份有限公司出版,一九九一年,PCDOS,主要功能是輸入鶴佬語拼音,顯示出漢字抑是羅馬字。
  2. 蘇芝萌,《HOTSystems鶴佬台文系統》,蘇芝萌出版,一九九五年,主要功能是輸入鶴佬語拼音,顯示出漢字抑是羅馬字。
  3. 江永進,《台音輸入法》,清華大學統計所,一九九四年。
  4. 鄧守信,《台語自動標調法》,台灣師範大學華語文教學研究所,一九九五年。
  5. W.W.W.網路上有一個可供使用者自由抓取(FTP)的軟體,網路位址是:http://www.umdnj.edu/~chenchen/info/book.html––暗光鳥––Booklistby冊單––《掠軟體》

二、全球資訊網上之相關資訊站:

全球資訊網上已經有很多台灣文學、文化方面的資訊站,筆者依類別列出幾個站供大家參考,使用者可以依網路位址找到,轉載的時間是一九九六年四月底。類似的資訊站應該會越來越多,使用者除了到下列網路位址尋找外,也可以利用網路搜尋工具「GAIS」尋找(位址:http://www.edu.tw:8080/cwww.html/

1.台灣文學方面:

甲.台灣文學作品的粟倉

位址:http://www.umdnj.edu/~chenchen/lit.html

內含:以台語、客語寫作的常民文學及蕃薯詩社作品。

乙.台灣文學專區:

位址:http://gopher.nsysu.edu.tw/sccid/database/literary/literary.htm

內含:文學性雜誌.期刊專區、社團與詩社專區、鍾理和專區、葉石濤專區、彭瑞金專區、鍾鐵民專區、吳錦發專區、鄭炯明專區、林雙不專區、林文義專區、江自得專區、曾貴海專區、王浩威專區、王家祥專區、陳玉峰專區、劉克襄專區、史英專區、沈振中專區

2.台灣文化方面:

甲.台灣社會文化資訊站:

位址:http://taiwan.csie.ntu.edu.tw/

內含:台灣相關資源:蕃薯藤網路——本土的、草根的、文化的;台灣歷史年表(籌畫中敬請期待);台灣空間生態(籌畫中敬請期待);南方社區文化互動式資料庫;交大台灣研究社台灣文化資料庫(Gopher),台灣文化專區(Gopher)

乙.台灣新文化:

位址:http://www.seed.net.tw/~frontier/culture/

內含:民間藝術表演團體、民間藝術工作室、民間環保機構、民間文化工作室、民間文化機構、本土文化研究基金會、本土文化出版單位、本土文化博物館

丙.台灣文化•文化台灣

位址:http://www.seed.net.tw/~frontier/home/sept/index.html內含滬尾文化工作室、安平巡禮等。

丁.蕃薯藤網路

位址:http://www.seed.net.tw/~frontier/home/

內含:人文、社會科學、社會與文化資料。

戊.台灣文化資料庫

位址:gopher://g834315.Hung.AB.nthu.edu.tw/

內含:台灣史地文化、社會文化、語言民族、風土自然、政黨政治等資料。

3.海外相關社團:

甲.全美台灣客家會(Taiwanese Hakka Association of USA

位址:http://www.softidea.com/twhakkausa/

乙.北卡州立大學台灣同學會

位址:http://www2.ncsu.edu/eos/project/tsa/htdoc/index.html

內含台灣話學習中心

4.台灣研究相關出版資訊:

台灣文學作品的粟倉內,Booklistby暗光鳥。

位址:http://www.umdnj.edu/~chenchen/lit.html

內含教材、文學選集、個人選集、傳統文學、口述文學、詞典、字典、理論研究探討、有聲書、電腦軟體。

陸、結語(以下以台文漢羅並用方式書寫)

牽引台灣文學e藤蔓上全球資訊網,需要結合整體e力量做宏觀的規劃。

台灣文學e教學、研究kangkuegah台灣文化e蒐集、整理、保存、發揚等kangkue,已被耽誤了數十年。民間文學方面:「六十幾年前,賴和先生已在感嘆,若不及早采集,恐怕為時已晚。而今在充分工商化的六十多年後,能說善唱的民間文學保存者當然更屬稀罕,即時有心人現在及時醒悟,及時參與搶救民間文學的工作,能搶救多少都很難說了。但是,若不及時醒悟,不及時搶救畢竟還是更可惜的,因為,如果現在再不做,以後一定會後悔。」(10)親像胡教授所言,好不容易現在有了一點點空間,團結民間e力量,有效利用現代科技,di最短e時間內ga過去e空白彌補起來,以最快e速度ui逐漸凋零e老人口中,ga民間文學采集記錄下來,北美洲原住民:「站出來利用壓迫者無遠弗屆的網路科技來聯繫分崩離析的五五○個族群,而不是待在壓迫者劃定的保留區中自怨自艾,自生自滅。」e覺醒,攏是值得我們警惕與借鏡。利用無遠弗屆e電腦網路科技,無疑ejit是上好e選擇,網路上風起雲湧e各種資訊站親像雨後春筍按呢出現,台灣文學、文化工作者ma不敢缺席,但是分散e力量ho每一個系統維護e人都有:「腳手有限,無四序e所在希望逐家體諒。」(暗光鳥)e不安,如果會凍gaine成果整合起來,應當有一加一大於二e力量。台灣文學e研究發展,大學中文系扮演chun重要e角色,deh成立台灣文學系e願望iauve達成進前,製作台灣文學網路系統,並且deh大學開設電腦網路資源利用e課程,除了訓練中文系e學生使用電腦資源外,ma可以作為推廣台灣文學網路教學e主要力量。

筆者從事中國古典文學電腦系統gah網路系統研究kangkue四、五冬,在在deh思考如何ga中國古典文學數位化e經驗,應用deh台灣文學上。身為hakka子弟,捧讀胡萬川教授主持採集整理ehakka歌謠、hakka故事,心中有感動、有慚愧,藉著jit篇小文章,ga家己幾年來經驗gah思考e心得作一次整理,希望會凍對台灣文學e教學研究發展有一點實質e幫助,只是個人對台灣文學e接觸siunn少,若有不及,尚祈各位雅正。ma感謝清華大學胡萬川教授、陳萬益教授、陳素主小姐惠賜資料ho我參考,gaho我真濟其他e指導。

作者按:

結語部分除了引文之外,都以台文漢羅並用的方式書寫,一方面以實際的行動支持漢羅並用的觀點,一方面嘗試台文的寫作。但是台語不是筆者的母語,因此文中所用有限的台語詞彙是從江文整理出來的,江文是筆者第一次閱讀以台文書寫的論文,結語是筆者第一次嘗試台文寫作。筆者先以漢文寫好,再對照依江文整理的台文詞語,花了十多分鐘修改成台文,想試驗整理台文詞彙對練習台文寫作的效果。修改的方式是先將「的」字用電腦上「Replace」的功能換成「e」,(其餘亦同),然後重新檢查潤飾一遍,若仍有不盡合台文的地方,應是筆者台語詞彙不足。各位看倌以為如何?

附註:

  1. 陳萬益,〈台灣文學設系芻議〉》,第一屆台灣文學研討會,淡水工商管理學院主辦,一九九五年十一月。
  2. GlenMartin文,鄭冠榮譯,〈印第安網路大戰––北美洲原住民利用網路連結五五○個不同族群〉,《當代》,一一八期,一九九六年二月一日,頁22-29
  3. 江永進,〈選擇台文文字方式e一寡準則〉,《台灣研究通訊》,五、六期合訂本,一九九五年九月。
  4. 胡萬川總編輯,《台中縣民間文學集九,石岡鄉客語歌謠二》,台中縣立文化中心出版,頁一零六。
  5. 中研院近史所網路位址:http://www.ihp.sinica.edu.tw/database/index.htm,內含:漢簡圖像資料(鎖碼)、漢簡本文資料(限院內使用)、歷代名臣奏議、明清檔案。中研院文始終文全文資料庫位址:http://www.sinica.edu.tw/imh/search/search.html,內含:史事日誌、廿五史、台灣方誌、十三經、諸子、文心雕龍、新清史本紀、古籍十八經、佛經三論等,均限中研院內使用。
  6. 請參見拙作〈D.I.Y唐宋詞多媒體網路教學系統〉,《中國古籍整理研究出版現代化國際會議論文集》,一九九五年七月,北京中國中文信息學會印製。或見國科會八十四學年度專題研究計劃,計劃名稱同論文名稱。
  7. 李貞德、陳弱水,〈中研院史語所漢籍全文資料庫介紹〉,《兩岸古籍整理學術研討會論文》,國家圖書館漢學研究中心、全國高校古籍整理研究工作委員會,一九九六年四月。
  8. 周長楫,《詩詞閩南話讀音與押韻》,敦理出版社,一九九六年元月十五日出版。
  9. 林玫儀,〈韻律分析在宋詞研究上之意義〉,中央研究院中國文哲研究集刊第六期,一九九五年三月。
  10. 胡萬川,〈工作與認知–台灣民間文學的蒐集與整理〉,台灣師範大學本土文學學術會議,一九九六年四月。