LIVAC共时语料库简介

screenshot

中心消息

LIVAC汉语共时语料库(Linguistic Variation in Chinese Speech Communities)与众不同,因为它以严紧、恒常与「共时」方式,搜索和处理了超常的大量汉语具代表性报章语料,并通过精密的技术,累积了泛华语地区众多精确的统计数据。本语料库最大特点是采用「共时性」视窗模式,剖析来自香港、北京、上海、台湾、澳门、星加坡等多地的定量华语媒体语料。直至2020,LIVAC已处理逾7.0亿字,累积并持续提炼出二百多万词条。 LIVAC所收集各地语用数据,可供各种比较研究,并方便有关的信息科技发展与应用。此外,语料库又兼顾了「历时性」,方便各方人士以专词搜索(KWIC),以便客观地观察与研究20年视窗内的有代表性的语用发展全面动态。经过协调与配合个别客户需求,例如针对性以地区、时段或范畴,LIVAC曾为多个公私营机构提供服务,包括语言工程,资讯服务,词典编著,媒体分析与教育方面机构等。 LIVAC由香港城市大学语言资讯科学研究中心开发和推展,由城大企业有限公司旗下麒麟(香港)有限公司提供技术支援。 2010年至2013年期间,LIVAC由香港教育学院语言资讯科学研究中心维持。自2013年7月起,LIVAC由麒麟(香港)有限公司独家维护和开发。(更多背景信息)

另见维基百科的英文参考资料: https://en.wikipedia.org/wiki/LIVAC_Synchronous_Corpus

本语料库暂提供1995年至1997年的语料,欢迎首次使用者试用。
如需更多年份数据,请联系我们@ http://www.chilin.hk