第三屆中國語文教育的「學理與應用」國際學術研討會

銘傳大學主辦

八十九年十二月一日

 

中國古典詩的多語言讀音自動標注系統對教學與研究的應用探討
----以台灣古典漢詩為對象

The Applicational Study of the Multiple-Dialect Automatic Phonetic Identification System
for Chinese Classic Poetry over Teaching & Researching - Based on Taiwan Classic Han Poetry

 

羅鳳珠•元智大學中國語文學系講師

台灣師範大學國文研究所碩士

桃園縣中壢市遠東路135號

電子郵件:gefjulo@saturn.yzu.edu.tw

共同作者:呂興昌(成功大學)、劉俞志(元智大學)、林志麟(元智大學)

 

     

 

中國各種形式的文學作品之中,詩歌最具有聲情的特色,需要經過吟詠朗誦,才能完全展現詩歌的內涵情境。

 中國古典詩歌講究聲韻之美,所以有一定的平仄及押韻的格律,平仄聲調分平、上、去、入四聲,押韻大抵依平水韻。然而,現今通行之國語已經沒有入聲字,台語及客語還保留入聲字,因此,以國語朗讀古典詩,無法準確掌握聲調,台語及客語還保留了入聲字,因此用台語及客語發音,能辨識入聲字。

 本文以台灣古典漢詩為對象,研究音韻自動標注系統,以電腦自動標注國語、台語與客語三種語言,探討其對於教學與研究的應用成效。標注的符號,國語讀音採用國語注音第一式及漢語拼音二種符號;台語、客語採用羅馬拼音符號,以方便台灣及台灣之外地區的使用者使用。(見附圖)

 本研究擬全面收錄台灣古典漢詩,也將引用既有之唐宋詩全文檢索系統技術、音韻自動標注技術,建立台灣古典漢詩全文檢索、音韻標注功能,提供網路教學、自學與研究之用,所研發的台語、客語標音功能,亦可回饋到唐宋詩詞之台語、客語讀音標注工作,以擴大其使用範圍。

  本文也將詳細論述建置一個台灣漢詩的研究與教學網站,所包含的系統規劃、程式設計等相關問題,以與同好切磋參考。

 

關鍵詞彙:

台灣古典漢詩、音韻自動標注、聲韻、台語、客語、全文檢索

 

      

 

壹、    前言研究背景

 

中國的古典詩歌大盛於唐、宋,在質與量方面俱有可觀。其後,宋詞、元、明、清曲繼之,古典詩歌以不同的形式綿延不絕,而這些文人大多數位居中國大陸。

位居海隅的台灣,昔為荒陬之地,明代以來,漢人東移,漢土文化隨之傳入台灣。清人入主台灣後,仕宦隨之聚集,常以詩酒寄情,文風大盛。清末台灣陷入日本統治,文人一方面寄悲憤於吟詠,一方面設立私塾,傳播漢文化的種子,文人紛紛成立詩社,吟詠漢詩,學習漢文,漢詩成為台灣全民文學。台灣光復後,隨之大陸淪陷,中原名流東渡,與台灣詩人共承遺緒,文風再振,乃使台灣三百餘年詩脈得以綿延不墜,並留下為數可觀的作品。

     在中國各種形式的文學作品中,詩歌最具有聲情的特色,需經吟詠,才能完全體會其中韻味。中國文獻資料中,對詩歌的定義,最早的記錄見於《尚書》〈堯典〉所言:「詩言志,歌永言,聲依永,律和聲。八音克諧,無相奪倫。」1其後有《禮記》〈樂記〉曰:「詩言其志也,歌永其聲也,舞動其容也。」2《詩》〈大序〉更進一步詳析:「詩者,志之所之也。在心為志,發言為詩。情動於中而形於言;言之不足,故嗟嘆之;嗟嘆之不足,故永歌之;永歌之不足,不如手之舞之,足之蹈之也。」3從這三段文字可知,詩與歌是相關連的,也正因為詩可以發而為歌,所以特別講究其節奏與韻律,使其更具有音樂性。

台灣古典漢詩所用詩韻,大體沿襲唐代詩韻,唐代詩韻分平、上、去、入四聲,而今通用之國語已經沒有入聲字,台語及客語還保留入聲字,因此,以國語吟詠唐宋詩或台灣古典漢詩,遇到入聲字無法準確發聲,而有不協韻的現象,只有用台語及客語發音,才能準確辨識入聲字。

    本研究擬以筆者所主持之「網路展書讀----中華典籍網路資料中心----唐宋詩詞系統4,已建立國語讀音標注之技術,結合成功大學台灣文學研究所呂興昌教授所主持的「台灣文學研究工作室網站」5的成果結合,在已有的基礎之下,以台灣古典漢詩為對象,研發音韻自動標注系統,以電腦自動標注國語、台語與客語三種語音,標注的符號,國語讀音採用國語注音第一式及漢語拼音二種符號,台語、客語採用羅馬拼音符號,以顧全使用習慣,並方便台灣及台灣之外其他地區的使用者使用。

 本研究擬全面收錄台灣古典漢詩的資料,同時也將引用既有之唐宋詩全文檢索系統技術,建立台灣古典漢詩全文檢索功能,使本系統具全文檢索功能以及音韻自動標注的功能,用以提供網路教學、自學與研究之用。所研發的台語、客語標音功能,一者可回饋到唐宋詩詞之台語、客語讀音標注工作;再者可以進一步提供以電腦標注、分析、整理台灣古典漢詩語料庫使用。

 

貳、讀音標示的重要性及其學理基礎

        中國文字屬於方塊字,單字單音,每一個字都含有形音義三個要素。中國文字經過歷代演變,產生一字多形、一字多音、一字多義的特性。其中尤以音義之間的關係最為密切,因此引用資訊科技做為中國學術的研究工具,形音義的標示是一項重要的工作。因為「音隨義轉」的特性,使得讀音標示的重要性佔形音義三者之首。

 根據齊沖天所著《聲韻語源字典》之〈第一編論聲韻語源〉曰:「我國傳統語言學的發展,是從訓詁學開始的。漢代的四本語言學專著《爾雅》、《方言》、《說文》、《釋名》,都從不同角度致力於訓詁。漢代訓詁有一個共同的特點,就是注重聲訓,即聯繫語音以解釋語義。不僅那四部語言學專著如此,漢代註釋古書的人,也同樣注重聲訓。」6

 徐超著《中國傳統語言文字學》〈第二章音韻學〉曰:「語言是以語音為物質外殼,以詞語為建築材料,以語法為結構規律而構成的系統。作為語言物質外殼的語音,它既有物理屬性、生理屬性、又有社會屬性。」7作者於同章之末節也指出音韻學的應用範圍,包括可以幫助句讀、校勘、可以用於識別增形字、換形字、增聲字和換聲字、可以了解古籍中的特殊讀音、幫助考證語源、識別同源詞、考證方言淵源關係、各類古音通轉關係、幫助破解文字通假關係等等。

 解決音韻的目的在於訓詁,在於解釋字義、詞義,因此徐超在〈第五章語源學〉進一步說明曰:「所謂『語源』,實際上就是『詞源』。但不是『詞語在文獻裡最早出處』的詞源,而是指詞語的音義來源。既然講『來源』,就不是一個詞語的問題,至少他要討論到此詞與彼詞的關係,及涉及到兩個或兩個以上的詞。

……因此,語源學所要研究的,實際上主要還是同源詞(又叫同族詞)的問題,及研究一個或多個詞語的歷史的淵源關係,屬歷史語言學的範疇。他的任務是上推語源,下求流變,藉此聯繫同源詞,進而探求詞語的孳生規律,建立科學的語言學理論等。傳統語言文字學裡的『聲訓』和『推源』等訓詁方式大致可以看成是語源探究的性質。」8徐超還進一步指出:「傳統語言文字學裡的語源學研究,是以『聲訓』的名目和形式出現的。什麼是『聲訓』呢?聲訓是指就字(詞)音來探求語源和貫通詞義的訓詁方法。……這就從研究內容(語源、同源詞)和研究手段(借助於語音分析)上跟語源學差不多取得了完全的一致。他們都是以研究詞彙的同源系統為主要目的的。」9由徐超這段文字可知,語源與流變之探求以語音分析為主要手段(方法),也可以在探求了語源與流變的軌跡中,分析語義的流變與關係。因此,字音與字義、詞義的標示息息相關。把語源與流變標示出來,建立語源流變資料庫,有助於更正確的建立字音與字義、詞義資料庫,這個資料庫除了提供語義學、詞彙學的研究之外,還可以分析出同義字詞,提升檢索的完整性。

  

參、研究目的及重要性

    經過各方多年的努力,引用電腦作為教學與研究的輔助工具,已經有很好的模式與成果,隨著全民終身教育風氣的興盛,同步與非同步的網路遠距教學課程的需求也越來越迫切。傳統教學的教材準備工作,授課老師能獨力完成,但是建置一個提供全民終身教育使用的電腦教學環境,需要有完整的研究資料庫作為後盾,提供授課者準備教材、提供學習者查詢資料,也需要有一些輔助性的工具,提供授課者與學習者進行互動的機制。一個好的電腦輔助教學環境的建置,需要多方面人才的結合,與傳統教學有顯著的差異,授課老師比較難以個人的力量完成。

     本研究的目的,除了建構一個語文教學網站之外,也嘗試建立教學網站的模式,從「電腦輔助教學環境的研發」、「台灣古典漢詩的教學與研究」兩方面培養相關的人才,累積相關的經驗。分述如下:

 一、在電腦輔助教學環境的研發方面

(一)藉著新工具的開發以輔助難以單獨憑藉人力完成的研究課題:嘗試利用電腦優於人腦的搜尋、整理、分析能力,建立需以廣大多元資料為研究範圍的學術研究論題模式,過去以人力難以完成的研究課題,藉著新工具的開發,能有不同的成果。

(二)探索資訊科技與人文研究結合的新方向:過去十年,電子全文檢索系統,以文字資料庫為主,少有標   示讀音提供教學使用之中國文學相關系統,讀音標示工作可引導中文數位化工作邁向新的里程碑,擴   大電腦科技在人文學科教學與研究工作的應用範圍。

(三)透過電腦文史研究環境的建立,使電腦更具人工智慧:電腦強大的搜尋、檢索、記憶、儲存能力,誠然優於人腦千萬倍,「能」節省大量以人力搜尋資料的時間;但是電腦「不能」取代人類的思維活動,「不能」理解文學情意感發的內涵。善用電腦優於人腦的特性時,如何透過系統設計與語言知識結構標注,縮短電腦「能」與「不能」之間的距離,使之更具人工智慧,更符合文史研究使用的需求。10

(四)從單一文字信息擴充到形音義多元信息:將單一文字信息擴充到形音義多元信息,使電腦做為中國文   學研究與教學工作跨出一個新的里程。日後若能再擴充為字形、字義的標示,詞性、語法的標示,可   以構成較完整的語言知識網路結構。

在台灣古典漢詩的教學與研究方面

(一)本研究的主要目的在於將資訊科技應用在中國文學領域的教學與研究。嘗試藉助資訊科技的特性,協助人文學門的研究與教學工作。

(二)中國文字屬於方塊字,每一個字包含字形、字音、字義三部份,因字體演變的關係,有些字一字多形、一字多音、一字多義。中國文學由中國文字組成,所牽涉到的形音義變化極多,古典詩又是一個特殊的文學形式,音與義的變化更為複雜。詩歌講究「言有盡而意無窮」,講究「不著一字而盡得風流」,詩歌是精緻的語言藝術,因此在形音義的變化上與其他形式的文學有明顯的不同。

(三)在電腦不具思考能力,不具審美能力,不具感發能力之前,引用電腦作為詩歌教學的輔助教材,語文的標示工作便是重要且必要的前置工作。形音義的標示工作又以讀音的標示最為重要,中國文字大抵一字多音,以電腦標示讀音時,遇到多音字,電腦無法正確選擇,需要透過各種基本資料協助,才能提高讀音自動標示的正確性,本研究即在研發標示的方法。

   國語為現在通行的語言,但是國語沒有入聲字,在講究聲情的詩歌文學中,聲調是非常重要的一部   份,而台語與客語保留了入聲字,因此本研究擬標示台語及客語讀音,一者完整呈現語音的原貌,再   者在台語與客語逐漸消失的情況下,台語與客語讀音標示的工作,對於保留母語傳承的語言,以及語   言的教學有重要的意義;三者加註台語與客語的讀音,可以提高讀音自動標注的正確性,尤其遇到入   聲字便需依台語與客語加以判斷。

(四)本研究讀音顯示的方式,擬在全文檢索的基礎上做處理。在全面收錄台灣古典漢詩的資料後,以既有的唐宋詩全文檢索技術,移植到台灣古典漢詩,建立全文檢索的功能。使用者查詢到任何資料,可以選擇標示本系統所提供的各種讀音以及各種拼音符號,甚是方便。這個工具的開發,可以開拓新的台灣古典漢詩教學工具,開拓新的台灣古典漢詩研究領域,擴展其應用層面。

肆、研究方法與原因

 

一、    在讀音標示方面

   因應語言特性的不同,採用現今較通用的音標標示,如國語讀音,標示注音符號以及漢語拼音;前者是台灣通用的音標,後者是中國大陸及國際通用的音標,這樣可以符合使用習慣並方便較大多數的使用者。台語及客語部份採用羅馬拼音,不標示注音符號。採用羅馬拼音的原因是向來轉譯西洋或中國經典如聖經、四書等,不管客語或台語,都已使用了這種標音法;不標示注音符號的主要原因是因為台語及客語中有很多讀音在國語裡沒有,以注音符號標音有實際上的困難。

 

二、在系統設計與功能方面

(一)    以人性化的雙向互動為系統發展導向:本系統最大的特色在於以更接近人性化的「使用者與系統可以雙向互動」為發展導向的觀念與方法。從使用者需求的角度,以「使用方便」為系統設計的優先考慮,並兼顧「管理方便」的原則,設計一個雙向、靈活、方便、快捷、人性化的網路資料系統。

(二)    建立開放式的系統架構:建立開放式的網際網路系統架構,讓相同的系統架構可以應用在內容不同,體裁相同的文學上。從開發與管理的角度來看,可以節省系統規畫與程式設計的時間;從使用者的角度來看,使用者只要學會使用一個系統,便能使用第二個系統,避免重複學習的困擾。

(三)    提供自助式的個人工作平台:提供自助式的個人工作平台,使用者在這個工作平台中可以編纂自己研究與教學的資料,讓系統對不同使用者需求的侷限降到最低,使系統更具有彈性。

(四)    建立雙向式的資源共享空間:使用者對於系統漏收的資料、新增的資料可以存放於此,讓資料的蒐集從管理者單向蒐集擴充到所有使用者多向全面蒐集,提高資料的完整性與更新的速度。

(五)    建立網路教學討論系統:透過網路教學功能的設計,使教學成為沒有時間與空間限制的即時線上教學,還可以整合校際資源,使教學資源共享。

(六)    資料庫多元結合使用:網際網路上各種資源充沛,Browser具有鏈結的功能,可以與網路上其他的資料庫多元結合,靈活使用。

(七)    以全球資訊網(World-Wide Web)為傳輸標準:藉由WWW瀏覽器,使用者便可透過Web Server取得網際網路上的檔案,或對資料庫進行查詢。WWW更整合了超文件(Hypertext)、多媒體(Multimedia)等技術,使得使用者非常容易透過網際網路取得所需的資訊。

(八)    NetscapeMicrosoft Internet Explorer為全球資訊網瀏覽器,以ASP Active Server Page)為主要開發工具:NetscapeMicrosoft Internet Explorer是目前最受歡迎的瀏覽器。以大多數人所熟悉的瀏覽器做為本系統前端之使用者界面,將有利於減少使用者的學習時間。ASPIDCInternet Database Connector)的下一代動態處理網頁規格,使用彈性較IDC優異。

伍、執行步驟

 

一、全面建置台灣古典漢詩的資料庫:本研究擬採用《台灣先賢詩文集彙刊》(龍文出版社出版)為底本,全面輸入該書所蒐集之台灣古典漢詩,作為本研究的基礎資料,日後再藉著「雙向式的資源共享空間」增補新增資料,並與其他版本的台灣古典漢詩彙校。

二、開發全文檢索系統:本系統讀音的顯示建立在全文檢索系統的基礎上,因此錄入台灣古典漢詩之後,引用唐宋詩詞的全文檢索技術,開發台灣古典漢詩的全文檢索,一方面方便教學與研究時檢索資料使用,一方面顯示讀音。

三、建立詩譜資料:古典詩有固定的格律,建立詩譜資料,可以明確標示每一個位置的字該用平聲或仄聲,這個工作是判斷多音字讀音的輔助工具。

四、建立韻書資料:詩譜資料只分平仄,韻書資料細分為平、上、去、入四種聲調,建立韻書資料也是判斷多音字讀音的輔助工具。

五、建立讀音資料:以字為單位,將台灣古典漢詩的每一個用字,標上所有的國語、

六、台語與客語的讀音資料,作為本系統的基本讀音資料庫。

七、建立讀音對照表:建立每一個字的國語讀音(以注音符號、漢語拼音)、台語讀音(以羅馬拼音標示)與客語讀音(以羅馬拼音標示)資料對照表,作為本系統的基本讀音資料庫。

八、建立入聲字與國語讀音對照表:入聲字散入國語讀音的第一聲(如屋字)、第二聲(如竹字)、第三聲(如髮字)、第四聲(如月字),建立入聲字與國語讀音對照表有助於平仄聲調與讀音的交互參照判斷。

九、以程式判斷正確的讀音:由於中國文字大多一字多音,因此遇到多音字時,須協助電腦判斷,其判斷程序與方法如下:

(一)優先選擇使用頻率最高的讀音,但是若遇到某些多音字有兩個使用頻率相當的讀音時,便無法判斷,例如「長」字的「ㄔㄤ2聲」與「ㄓㄤ3聲」的讀音,使用頻率相當,此時便須加上第二個判斷條件。

(二)以該字所在位置的平仄判斷,如果這個位置應該用平聲字,那麼這個字讀仄聲的機率便比較低,可以先選擇平聲字標音。

(三)如果與該字的平仄相符,而其不同的讀音又同屬平聲或仄聲時,便須以區分更細的韻書判斷,但這個判斷只有該字出現在韻腳的位置才適用。判斷的方法是先判斷該首詩所押何韻?如果同為平聲,該首詩如果押上平聲韻,那麼該字讀音屬於上平第一聲的機率便比下平第二聲較高;同樣的,如果該詩押去聲韻,該字讀為第去聲第四聲的機率會比上聲第三聲高。

(四)台語與客語讀音判斷入聲字,出現在韻腳位置的讀音,還須檢查是否屬於入聲字。

十、以程式標示正確的讀音:透過程式的控制,循上列的檢查步驟,判斷並標示讀音。

 

陸、系統開發使用技術:

 

  為使本系統能滿足使用者的需求,且因應時代趨勢,提供更有效率的使用環境,同時也考量系統開發、維護與未來的延展性,整合運用了多項資訊觀念與開發技術:

一、主從式(Client / Server)系統架構:將系統的功能依其特性分散在適當的工作平台上進行,以便提高系統的整體效率。

二、小型化(Downsizing)資料庫與主機:近年來軟硬體技術的突飛猛進,使得傳統對於「資料庫一定要放在大型主機上」的觀念已經改變,無論在系統投資成本與開發效率上,皆能以更經濟有效的方式進行。

三、整合式WWW應用系統開發環境:若以傳統的WWW程式設計方法,既浪費時間又沒有效率,再加上除錯困難,程式間的關連性與時效性也難以判斷,以致於造成系統開發者嚴重的負擔。而在目前最新的WWW程式整合開發環境中,不但可以在同一個環境下進行程式撰寫、執行與除錯等工作,還可利用輔助工具處理資料庫連線問題;在團隊開發系統的狀況下,還可進行版本檢查與避免修改衝突的發生。

四、單一的程式設計方式:為了系統整合、後續發展與維護的單純性,本系統皆採用Active Server PageASP)程式搭配Hypertext Markup LanguageHTML)、VBScriptJAVA Script語法來設計。

五、面對未來的系統發展,我們期待能引進更多的資料儲存與操作方式(例如能處理多類資訊的資料倉儲),或是新的更有效率的系統開發模式,加強系統的實用性與便利性,以期更能滿足使用者多樣化的教學、自學與研究的需要。

 

 

柒、           系統評估

 

本系統在建置完成後,為確保系統的正確性與可用性,將分別針對系統功能與執行效能兩方面來加以評估。

一、    系統功能:

(一)全文檢索功能:含ANDORNOT等運算。

(二)音韻自動標注功能:含國、台、客語之音韻標注。

二、    執行效能:

本系統係建立於開放網路環境中,並採主從式(Client / Server)系統架構設計,將系統的功能依其特性分散在適當的工作平台上進行,以便提高系統的整體效率。造成系統效能不佳的原因可能有網路頻寬的限制、使用者人數的限制與系統設計不佳等。針對各項影響系統效能的因素,採用的評估方式如下:

(一)網路頻寬:

使用網路流量監控軟體,分析系統被使用的情況,進一步作為調整系統效能的依據或是設備調整的參考。

(二)使用者人數之控制:

由於本系統係建置於開放網路環境中,因此對於系統使用者人數較難以去估計。當線上使用者一多,很容易造成系統效能低落(thrashing)。為達到系統預期的效能,擬透過撰寫程式收集在同一時段,不同使用者人數與其所下之不同之查詢(簡單或複雜)之回應時間(response time),以此作為評估系統效能的依據,去調整系統最大使用人數的設定。

(三)系統設計之調整:

定期針對使用者需求,分析使用者常用之查詢,評估系統設計需要調整的部分,如索引的調整、與表格的合併等。

 

捌、對台灣古典漢詩研究與教學的具體效益及具體成果

 一、提供台灣古典漢詩研究者一個良好的研究環境與研究工具,節省資料蒐集、檢索與整理的時間。

二、提供較完整的台灣古典漢詩網路教學環境。

三、保存國語、台語與客語的讀音資料。

四、跨朝代資料庫韻腳的標示工作,可提供古今聲韻演變的研究。

五、從單一朝代的文學資料研究,擴充到跨朝代資料的研究,使研究的參照資料更豐富,研究視野更寬廣。

六、以電腦協助研究資料的蒐集、分析、整理,使文史研究可以朝更宏觀的角度關照。過去單獨依靠人力很難完成的研究,透過全文檢索系統,可以節省蒐集、整理資料的時間,因此可以帶領文學研究者,嘗試需要龐大資料作立論基礎的研究工作。

七、將台灣古典漢詩資料建立於國際學術網路上,透過網路推向全世界,消彌了國外從事台灣古典漢詩研究者時空的隔閡,提升學術研究的效率。

八、網路教學的功能可以結合校際教學資源,使教學資源也能在網路上跨校共享。

九、可以從中尋找科技與人文平衡互補的界點,讓科技的發展能照顧到人文的關懷,人文的研究能有效應用到科技發達所帶來的方便性。

 

 

玖、期可能遭遇的困難及解決的方法

 

讀音自動標示工作,首先面對的問題是多音字的選擇,面對多音字,電腦如何判斷何時該讀何音?這個問題可經由幾個步驟判斷,已如前言。然而,在韻文中還有使動詞的讀音、古音、二字詞讀音變化等問題,電腦無法判斷,都會影響自動標音的正確性。

 

由於詩詞是一種形式比較特殊的文學作品,因此句法、語法都不同於散文等其他形式的文學作品;詩詞常使用使動詞以提升修辭的技巧,使動詞的讀音往往跟著改變,如此便會影響讀音標注的正確性。詩詞以古音協韻,如「綠」讀為「ㄌㄨˋ」,「斜」讀為「ㄒㄧㄚˊ」,這二個字的古今音平仄相同,今音使用頻率高於古音,所以無法依前面的規則判斷。二字詞的讀音變化,也是影響讀音標示正確率的原因之一,讀音自動標示的功能,建立在每一個單字的讀音基礎之上,但是在二字詞的讀音方面,常有轉音(音變)的情形,電腦在進行自動標示時,無法判斷二字詞讀音的變化,進而做出正確的修正。

 

解決這些問題,需要建立相關的知識資料庫,在使動詞的讀音變化方面,依《語言學百科詞典》為「使動詞」所下的定義:「把某種詞當使動詞用,即所謂動詞的使動用法。古漢語中尤多,不及物動詞、形容詞乃至名詞及數詞都可能作使動詞用。」11可知標示詞性可以初步解決使動詞讀音的標注。在古音方面需要先建立古音資料庫,並將系統檢查的功能設定為當標示古今音有差異的字時,設定為古音的選擇優先性高於今音。而二字詞的讀音變化就需要廣泛建立語料庫,語料庫的建立,除了可以因應「音隨義轉」的特性,更正確的標示多音字,也可以解決二字詞音變的問題。

 

壹拾、  未來的發展

 

電腦應用於教學或研究工作,誠然是很好的輔助工具,但截至目前為止,並不能完全取代人的工作。

 

引用電腦作為文學研究與教學的輔助工具,首先需要設定網站的定位,清楚訂出使用的對象,再依使用對象的需求建構系統、研發程式、充實內容,時時從使用者的角度思考,這是好的教學網站所必備的條件。

 

好的文學研究與教學系統,需要由文學的研究者與實際從事教學的老師主導規劃,才有可能建置出更符合使用需求的系統,但是由文學領域的人主導,常常會面臨不知電腦能做什麼?能做到什麼程度的窘境,依筆者多年經驗所得,筆者常從使用者的角度來思考,依使用的需要提出構想,交給資訊專長的工程師依所提出的需求進行程式設計,其次廣泛的留意新的技術趨勢已經有那些新的功能,再去思考這個新的功能是否能應用在文學網站,如何應用?對於新的技術趨勢,只要「知其然」,便可據以規劃,至於如何「知其所以然」就交給工程師去思考。

 以本研究為例,除了以上所提出的基本需求之外,還可以透過一些基本資的建立來提升使用效能,使電腦能做更多的事,例如:增加語音資料,建立自動語音朗讀以及語音檢索的功能;標示異體字詞之關係與標示同義字詞之關係,建立字形知識網路,使檢索範圍更完整;利用讀音資料以及詩歌句法之特性,作自動斷詞研究,建立台灣古典漢詩專用語料庫;建立語料庫之後,依「音隨義轉」的特性,提高讀音標示的正確性;建立字義資料,與字形、字音結合,再標注詞性、語法、句法,形成一個更具人工智慧的語文知識網路結構。凡此種種,都可以提升電腦的使用效益。

 

  以電腦輔助研究與教學,某些方面的效率確實比人腦快速,也解決一些比較難以人力去完成的工作,如大量資料的分析、比對,但是電腦並不是萬能的,應用於研究如此,應用於教學亦是。文科普遍採用電腦作為輔助工具,只有三、四年的時間,便已呈現一些問題,值得注意,其中最大的隱憂是學習者獲得資訊的數量太多,速度太快、存取太容易,使學習者忽略了深度思考的過程,研習學問過程中的博學、審問、慎思、明辨、篤行五個步驟,其中的「審問、慎思、明辨」,最容易在網路學習的環境中被輕忽,不可不慎。

 

參考資料:

  1. 引自中央研究院漢籍資料庫•十三經注(一八一五年阮元刻本)/ 尚書 / 虞書 / 卷三 / 舜典,網址:http://www.sinica.edu.tw/ftms-bin/ftmsw3?ukey=-2050260903&rid=-6
  2. 引自中央研究院漢籍資料庫•十三經注(一八一五年阮元刻本)/ 禮記注疏 / 樂記 / 卷三十八,網址:http://www.sinica.edu.tw/ftms-bin/ftmsw3?ukey=-2050260903&rid=-6
  3. 引自中央研究院漢籍資料庫•斷句十三經經文 / 毛詩 / 國風 / 周南 / 關雎,網址:http://www.sinica.edu.tw/ftms-bin/ftmsw3?ukey=-2050260903&rid=-6
  4. 網路展書讀----中華典籍網路資料中心----唐宋詩詞系統,網址:http://cls.hs.yzu.edu.tw。
  5. 臺灣文學研究工作室網站,網址:http://www.ncku.edu.tw/~taiwan/taioan/
  6. 齊沖天著:《聲韻語源字典》(四川:重慶出版社,1997年3月第一版),頁1。
  7. 徐超著:《中國傳統語言文字學》(山東:山東大學出版社,1996年6月第一版),頁120。
  8. 同註7,頁281。
  9. 同註7,頁282。
  10. 詳見拙作:〈中國古典詩詞教學與習作的新嘗試—網路作詩填詞系統兼及其可行性與侷限性〉,《教學科技與媒體》,1997年12月。
  11. 戚雨村等編:《語言學百科詞典》(上海:上海辭書出版社,1993年4月第一版)

附圖