古籍智能
我们将举办一系列古文NLP评测。以发布的语料为基准进行评测,推动古籍智能处理技术的发展。这些评测包括古籍OCR(文字识别)、自动句读、标点、分词、自动标引、专名识别、关系提取等。古文的评测尚处于初创期,将有广阔发展空间。我们预计每年将联合高校和企业举办一次评测,欢迎古籍相关专业师生、技术专家和爱好者关注、参赛!
今年正在进行的一项测评是第一届古汉语分词和词性标注国际评测EvaHan。主要通过对数据集的训练,对古籍文本进行分词、词性标注,检测分词和词性标注的正确率。详细内容请查看原文。