中国法律法规语料库

Parallel Corpus of Chinas Law Documents (PCCLD)

使用说明 Users Manual

中国法律法规语料库 (PCCLD)含中国大陆、香港和台湾三个子库,汉英总字词数2200万。子库间可通过点击自由跳转。

A.使用方法

1.确定搜索范围:

l       全部选用:

点击“全选”键。

l       个别选用:

  单个选用:鼠标点击欲使用的文件名。

  多个选用:Ctrl+鼠标逐个点击欲使用的文件名。

2.输入检索词:

l       “检索词”框内输入检索词一个或多个(|隔开),既可中文(简繁皆宜),亦可英文;点击“提交”。

3.提高检索精度

l       为提高检索结果精度,可在“但不包括以下检索词”框内输入需排除的一个或多个检索词(|隔开)

4.检索结果使用

l       检索结果可以选中复制。

4.阅读全文

l       在“选择搜索范围”中选中要阅读的法律文本;

l       在“但不包括以下检索词”框内输入任意字或字符,如“幽雅幽雅”;

l       “检索词”框留空,则可显示所选法律的全文。

l       说明:

①个别文件有句子无法正常导入情况出现,故在阅读全文时可能会有编号的间断或空缺。(本问题正在解决中。)

②全文阅读状态下限制选中复制。

 

B.本语料库的援引

在论文或其他出版物中在使用或援引本语料库资源,请注明(modified APA )

英文

   Sun, H. & Yang, J. (2009, August 12). Parallel Corpus of China’s Legal Documents(PCCLD). http://corpus.usx.edu.cn/ . Available MM-DD-YYYY.

中文

孙鸿仁、杨坚定(2009-08-12),中国法律法规语料库, http://corpus.usx.edu.cn/ 检索日yyyy-MM-DD

 

C.问题

简繁自动转换正在调试中,有时并不准确。如,已知“注册”目前无法转换为“註冊”。虽然这一问题目前正在解决,但为了提高查找准确性,如若检索港台法律法规,建议先对检索词做好简繁转换。