结构整理环节帮助文档
环节目标:标题完整且层级正确;分段恰当。
1.检查目录,修改标题格式
根据标题的层级,修改为对应的格式。
2.检查分段,保证正确分段,无异常断行。 对超长段落进行切分。
操作时长建议:每卷5-15分钟
快捷键:
- 卷Alt+1
- 篇Alt+2
- 章Alt+3
- 节Alt+4
- 小节Alt+5
- 说明Alt+S
- 正文/注文Alt+Z
- 撤销:Ctrl+Z
- 恢复:Ctrl+Alt+Z
- 断行检查:Alt+K
- 保存:Ctrl+S
书体格式整理示例
标题
修改方式:选中标题内容,点击工具栏,或使用快捷键,修改为正确的格式
原图样例 | 说明 | 整理效果 |
四层标题 :卷、篇、章、节、小节一卷仅有一个卷标题,其他标题按内容层级依次设置 | ||
古籍一般用缩进表示标题层级。这个缩进如果被OCR识别为空格,是不需要保留的 | ||
卷标题,在同一行 |
段落
整体上依从原书分段。
原图样例 | 说明 | 整理效果 |
破段:连续的文本 被错误的断行切开,应该合并段落。可以使用断行检查:Alt+K 快速查找不当断行 | ||
诗歌工整即可,一般按照每4句分一段。古籍常用空格表示诗歌断句,在OCR识别时,会识别为空格。这个空格不需要保留,删去即可。 | ||
【道藏】为表示对神灵、皇帝的尊崇,古籍原始刻本遇到“天尊”“圣上”等称号,会另起一行。此种情况应悉数合并段落。 | ||
书籍结尾会重复一下书名,但原始很多会将这个书名没有区分段落,需要进行段落区分。 | ||
超长段落遇超长段落(5行以上),可根据理解拆分(不强制) |
说明信息
原图样例 | 说明 | 整理效果 |
说明信息一般位于标题后。此处的作者、时间等,当作说明信息 |
正文/注文
原图样例 | 说明 | 整理效果 |
卷前扉页信息处理成连续正文即可 | ||
注文只针对古籍原书图像为双行小注、单行小注的文本进行标引为注文。 |
遇明显文字错误、标点错误,可改正。
点击打开自由编辑,可以删除/输入文字/标点、分段/回行 等,自由编辑书内容
一些常见问题:
错误示例 | 正确示例 | |
书名应被标为正文,不要被标为卷 | ||
标题下的这种,作者信息,藏地信息,都标成【说明信息】哈。 | ||
避免标两个连续的卷标题/篇标题。 到阅读平台会被切成两卷/两篇。 | ||
原始标题错误断行 | ||
“目录”内的内容,不要标标题。标正文和注文 | 案例 阅读平台效果: | |
“书名”标为正文格式 | ||
标题不要留注文 | 这样标注,上线后,注文会归上一篇 | |
卷尾的重复标题,要标成说明信息 | ||
标题较多的时候,可以打开目录看看是否是同一层级 | ||
标题中非常明显的标点错误,要改掉 |