今年7月,由全国高等院校古籍整理研究工作 委员会主办,北大数字人文研究中心、字节跳动公益承办,联合国内多家古籍研究机构共同 发起的“‘我是校书官’——古籍大众智能整 理计划”第一期活动圆满结束,成果丰硕!
“‘我是校书官’——古籍大众智能整理计划”利用识典古籍智能整理平台,发动全国高校大学生,在暑假期间义务整理海外回流的中国古代典籍。本次活动激发了高校学生参与古籍数字化建设的热情,成功探索了利用智能技术传播中国古籍文化的众包模式。
活动内容
- 古籍选目:海外汉籍数字回流逾千种
本次活动重点选取了哈佛大学燕京图书馆、普林斯顿大学东亚图书馆、日本内阁文库、法国国家图书馆的数字化善本1320种。为了激发大众参与热情,活动精心挑选了与现代生活和现代学科体系紧密相连的古籍书目,主要选目类型如下:
- 智能整理:AI助力古籍校对焕新生
本次活动依托北京大学数字人文中心与字节跳动公益联合开发的“识典古籍”平台展开,该平台是全球首个实现了全流程古籍智能整理的数字化平台,包括:OCR文字识别、自动标点、自动分段、自动校勘、自动翻译、命名实体识别等环节。
为了大规模普及古籍智能整理方法,一期活动将古籍OCR图文校对作为大众整理任务,即参照底本逐行确认Al识别的文字是否正确。
(文字识别任务演示)
成果展示
- 反响热烈!700+所高校参与!
截止8月1日, 一期活动累计共有724所高校的2549名学生参与,高校覆盖量和报名人数均超出预期。
- 成绩亮眼!5000+万字古籍校对!
截止8月6日,活动覆盖古籍数量432部,校对页数302,084页,校对字数 50,911,679字,社会实践时长10,400 小时,总贡献值达100,400个。
- 收获满满!600+份实践证书发放!
参与学生在活动截止前注册报名并按时、按质、按量完成任务后,即可获得高等教育学生实践信息网的社会实践认证证书,一期已有628人获得证书。承办效果良好的15所高校、30位指导教师获得荣誉证书。
- 传播广泛!300+万人次曝光!
本次活动通过第二课堂成绩单平台系统(以下简称“二课系统”)及其他官方和 自媒体平台扩散,曝光量达392w+ 人次 。
· 二课系统:站内曝光392W+
· 二课群扩散:触达17省的高校师生4717人
· 自扩散群:触达30余所高校及30余家图书馆单位
· 活动承办单位、承办校公号的阅读量达1.56W
活动期间,北大数字人文中心与字节跳动 公益联合制作了五讲“识典古籍智能通识 课”,面向大众普及古籍知识。该课程即 将在“识典古籍”抖音号上发布。
第一讲:从甲骨到AI的古籍穿越
杨浩 北京大学数字人文研究中心副主任、人工智能研究院副研究员
第二讲:中国古代大型典籍全攻略
刘蔷 清华大学科学技术史暨古文献研究所研究员
第三讲:那些散落在海外的中国古籍
杨海峥 北京大学中文系教授,中国古文献研究中心副主任
第四讲:一堂课学会古籍整理
廖可斌 北京大学中文系、中国古文献研究中心
第五讲:古籍整理的AI黑科技
杨 浩 北京大学数字人文研究中心副主任、人工智能研究院副研究员
未来展望
9月中旬,“‘我是校书官’——古籍大众智 能整理计划”第二期启动在即。活动将分为大众组和专业组两个层面展开。大众组预期参与人数超过10000人、预期参与高校超过1000 所,将在更大范围内传播古籍文化,普及古籍整理知识;专业组将招募具有古典文献专业知识的学生从事句读、校勘等深度整理工作,利用古籍智能整理平台,培养古籍数字化综合人才。活动内容将于近期发布,敬请期待!