主辦機構
香港中文大學圖書館研究支援及數碼創新部
台灣中央研究院數位人文中心
簡介
為推廣有關中文古籍文字自動識別技術的發展及交流,香港中文大學圖書館數碼創新部於去年首辦了「中國古籍文字自動識別挑戰2021」,吸引全球二十三隊不同界別人士報名挑戰。為繼續推廣交流相關技術發展,促進數碼學術研究,本年度與首屆冠軍——台灣中央研究院數位文化中心 (ASCDC)合辦「2022中國古籍文字自動識別挑戰」,盼能將中文古籍的文字自動識別技術再進一步。
挑戰競賽詳情及規則
時間表
2022年2月14日 (星期一) | 開始報名 |
2022年2月28日 (星期一) | 截止報名 |
2022年3月3日 (星期四) | 網上簡介會 |
2022年3月14 - 25日 | 網上競賽 (每天一挑戰,為期10天) |
2022年3月30日 (星期三) | 公佈得獎名單 |
2022年4月 (待定) | 網上頒獎禮及得獎隊伍技術簡報 |
參賽資格及報名
本屆分為學生組及公開組,不限地區,歡迎各界以團隊或個人名義參加:
·學生組:成員需為現正就讀於任何院校之學生,團體組別最多只容許一位教研人員加入
· 公開組:沒有限制
請到 https://bit.ly/3rp1ULH (2022年2月14日 (星期一) 開始) 報名,報名時需填寫隊伍資料及有關技術簡介。截止日期為2022年2月28日 (星期一)。
參賽準則
參賽隊伍需自行提供平台,大會會在其平台介面上載及處理當日文字圖像檔(TIFF) ,因此參賽者需確保於競賽期間能順利於限時內對每日上傳發放的中文古籍圖檔進行自動文字識別及供大會下載識別文字檔。每日競賽成績將以代號即日公佈。
評分標準
於限時內對文字識別準確度與輸出文字順序。
公佈結果與獎項
每組將會於每日個別收到當日的賽果,同時結果網頁亦會以隊伍代號公佈當日首五名的分數。優勝名單會於結果網頁公佈,而得獎隊伍需於2022年4月舉行的網上頒獎禮作技術簡報及交流。
獎項:
學生組 & 公開組成績最好三隊均設獎勵:
冠軍: 價值港幣8,000元之電子禮券 及 電子獎章
亞軍: 價值港幣5,000元之電子禮券
季軍: 價值港幣3,000元之電子禮券
知識產權
主辦單位保留一切原始來源檔案所有權,參賽者只可在此競賽時間內授權使用檔案。參賽者在未經主辦單位授權下不得使用原始來源檔案作其他用途。參賽者繳交參賽文字檔之版權歸主辦單位所有。
參賽者需保證參賽檔案所使用之技術或程式,均屬參賽者原創或已取得合法授權,若有任何第三者提出侵害知識產權或其他違法事項指控,必須由參賽者自行處理,並自負一切法律上之責任。
查詢
歡迎參閱有關競賽的常見問題。
如對競賽有任何查詢,請電郵至 dslab@lib.cuhk.edu.hk。
原文鏈接:https://dsprojects.lib.cuhk.edu.hk/zh-hant/2022-chinese-ocr-challenge/?fbclid=IwAR241_b2IkTzmQYYDA64vmQDu_YwU_qwSOtNRimGosOs53W5rIlMstYJ4-U