人機優勢互補 數碼人文以新角度鑑古觀今 - 明報升學網

人機優勢互補 數碼人文以新角度鑑古觀今

科技進步,電腦與資訊科技在人文學科的應用愈來愈廣,革新了固有的研究模式,也為學術研究帶來新視野和路向。近年興起 「數碼人文」 (Digital Humanities)的概念,在兩岸三地華文學界漸受注視。香港城市大學人文社會科學院中文及歷史學系助理教授徐力恆博士是這方面的專家,他期望運用個人經驗在學術界推廣數碼人文,促成更多合作,凝聚不同領域的學者共同參與研究,推展研究成果。

香港城市大學人文社會科學院中文及歷史學系助理教授徐力恆博士認為,數碼人文為人文學科研究帶來新視野,他期望在香港推動相關發展。
香港城市大學人文社會科學院中文及歷史學系助理教授徐力恆博士認為,數碼人文為人文學科研究帶來新視野,他期望在香港推動相關發展。

所謂數碼人文,是指利用電腦與資訊科技協助進行人文學科研究,最常見的例子是研究人員借助電腦處理龐大的資料和數據。徐博士指,人文學科研究最重要是資料的處理,因為資料關係到研究的深度和準確性,當涉及海量資料時,利用電腦較全然用人手處理更具效率和規模。科技不但帶來便利,亦為傳統人文學科研究造成衝擊,引發範式轉移。

顛覆研究範式 影響史料挖掘與整合

徐博士以史學研究為例說明。一直以來,學者及研究人員都是單靠個人力量,埋首圖書館,在書海典籍堆中尋寶,細心挑選合適史料,進行分析和解讀,從中發掘有意義和價值的史學命題作研究,再透過學術期刊或書籍著作發表研究成果。隨科技進步,尋找資料的渠道變得多元化,不再局限於館藏典籍,亦不受地域限制,如網上資料庫,透過互聯網隨時隨地可搜尋世界各地收藏的資料。另外,學者及研究人員可透過電腦整合龐雜的史料和數據,以電子地圖或統計圖表呈現歷史,作為研究論據與佐證,為辨析史料的歷史價值加強說服力和客觀性。除了刊載於學術期刊或出版書籍著作,他們還可透過網上資料庫、軟件或網上平台發表研究成果。互聯網無遠弗屆,透過網絡還可以讓更多人接觸和認識研究的課題與成果,喚起公眾的關注。

除了引發範式轉移,數碼人文的興起亦提升學術研究的深度,同時擴闊既定領域。徐博士解釋,利用電腦輔助,學者可更有效、更精準地處理龐雜的資料和數據,從中發掘新論據和佐證,重新討論學術界固有的見解,作出修訂、補充,甚至挑戰。科技讓學者能夠以更宏觀的角度和視野進行研究,例如唐代的墓誌銘詳細記錄逝者的功德事蹟、家族背景,甚至士族聯姻關係,一向是史家研究唐代官員和社會菁英的重要參考依據。電腦可將大量墓誌銘的資料作整合和對比,交織出一幅龐大的人脈關係圖,更深入了解士族之間的聯繫、勢力的興衰,以及對唐代政治走向的影響。

人機優勢互補 數碼人文以新角度鑑古觀今
分析史料數據,製成分布圖,助學者了解不同朝代進士籍貫的對比,黃點為唐代進士籍貫分布,粉紅點為北宋進士。

人機結合 互相補足

科技帶來好處,亦有其局限性。徐博士指,漢字數量、詞彙量驚人,單是利用電腦辨識古書典籍中的文字已不容易,加上古書典籍一般沒有標點符號,電腦系統自動處理斷句的效果長久以來未如理想,需要學者以其專業知識作判斷和介入。「數碼人文並不是要以電腦代替人腦,其精粹在於人腦與電腦的優勢互相配合,相輔相成,利用前瞻的方法研究過去。」徐博士認為,隨人工智能和機器學習發展日趨成熟,人文學者可訓練電腦協助進行更深入的分析,透徹了解歷史人物跟事件之間的脈絡和趨勢,透過局部修正,重新整合及理解史料,反思既有觀念,開拓新思維,擴展研究的精細度與範圍。

古籍文本沒有標點符號,需要人手解讀,訓練電腦進行數據化。
古籍文本沒有標點符號,需要人手解讀,訓練電腦進行數據化。

發揮獨特優勢 推動跨界合作

徐博士一直非常關注數碼人文的發展,在加入城大前曾參與「中國歷代人物傳記資料庫」的研究工作。該資料庫由哈佛大學、北京大學和中央研究院合作建立,利用電腦整理中國古代人物傳記記載的資料,包括曾到過的地方、書信往來和各種交流等,將資料化為數據。使用者除可查詢單一人物的傳記資料,亦可對一群古人做集體性研究,並透過地圖等不同形式,將他們的籍貫分布、活動範圍及社交聯繫等呈現出來。他表示,其實早在上世紀八九十年代,華文學界已經進行多項字庫整理、典籍數碼化和編著字詞索引等計劃,例如自1984年以後,一批學者將「二十五史」和《四庫全書》數碼化,隨後亦有香港學者逐步建立先秦兩漢至魏晉南北朝文獻的資料庫。雖然如此,華文學界過往對於數碼人文的關注度不足,直至近年才逐漸受到重視,本地多間大學紛紛推動,城大是其中之一。

徐博士指,城大人文社會科學院定位獨特,匯聚了人文學科和社會科學範疇的學者,他們涉足的研究領域多元化,專長亦各有不同,為促成跨學科、跨領域合作提供有利條件。他認為聯結不同的研究群體,凝聚不同領域專家的力量和資源,是數碼人文其中一個重要發展方向,亦是他擔當學院「數碼社會研究群」召集人一角,期望積極推動的目標。

返回頂端