LIVAC共時語料庫簡介

screenshot

中心消息
LIVAC漢語共時語料庫(Linguistic Variation in Chinese Speech Communities)與眾不同,因為它以嚴謹、恆常與「共時」方式,搜索和處理了超常的大量具代表性漢語平面媒體語料,並通過精密的技術,累積了泛華語地區眾多精確的語言和語用統計數據。本語料庫最大特點是採用「共時性」視窗模式,剖析來自香港,北京,上海,台灣,澳門,新加坡等多地有代表性的定量華語媒體語料。直至2016年,LIVAC已累計過濾25億漢字語料,並已處理逾6億字,累積並持續提煉出2百多萬詞條。LIVAC所收集各地語用數據,可供各種比較研究,並方便有關信息科技發展與應用。此外,語料庫又兼顧了「歷時性」,方便有意者以專詞搜索(KWIC),以便客觀地觀察與研究視窗內20多年來有代表性的語用發展全面動態。經過協調與配合個別用戶需求,例如針對性以地區、時段或範疇,LIVAC曾為多個公、私營機構提供服務,包括語言工程,資訊服務,詞典編著,媒體分析與教育機構等。LIVAC由香港城市大學語言資訊科學研究中心於1995年開發和推展,由城大企業有限公司旗下麒麟(香港)有限公司提供技術支援。2010年至2013年期間,LIVAC由香港教育學院語言資訊科學研究中心維持。自2013年7月起,LIVAC由麒麟(香港)有限公司獨家維護和開發。 (更多背景信息)

本語料網絡版庫僅提供1995至1997年的資料,歡迎首次使用者試用。

按此進入系統