结构整理环节帮助文档结构整理环节帮助文档
环节目标:标题完整且层级正确;分段恰当。
1. 检查目录,修改标题格式
根据标题的层级,修改为对应的格式。
2. 检查分段,保证正确分段,无异常断行。 对超长段落进行切分。
操作时长建议:每卷 5-15 分钟
快捷键:
卷 Alt+1
篇 Alt+2
章 Alt+3
节 Alt+4
小节 Alt+5
说明 Alt+S
正文/注文 Alt+Z
撤销:Ctrl+Z
恢复:Ctrl+Alt+Z
断行检查:Alt+K
保存:Ctrl+S
书体格式整理示例
标题
修改方式:选中标题内容,点击工具栏,或使用快捷键,修改为正确的格式
原图样例
说明
整理效果
四层标题 :卷、篇、章、节、小节一卷仅有一个卷标题,其他标题按内容层级依次设置
古籍一般用缩进表示标题层级。这个缩进如果被 OCR 识别为空格,是不需要保留的
卷标题,在同一行
段落
整体上依从原书分段。
原图样例
说明
整理效果
破段:连续的文本 被错误的断行切开,应该合并段落。可以使用断行检查:Alt+K 快速查找不当断行
诗歌工整即可,一般按照每 4 句分一段。古籍常用空格表示诗歌断句,在 OCR 识别时,会识别为空格。这个空格不需要保留,删去即可。
【道藏】 为表示对神灵、皇帝的尊崇,古籍原始刻本遇到 「天尊」「圣上」 等称号,会另起一行。此种情况应悉数合并段落。
书籍结尾会重复一下书名,但原始很多会将这个书名没有区分段落,需要进行段落区分。
超长段落遇超长段落 (5 行以上),可根据理解拆分 (不强制)
说明信息
原图样例
说明
整理效果
说明信息一般位于标题后。此处的作者、时间等,当作说明信息
正文/注文
原图样例
说明
整理效果
卷前扉页信息处理成连续正文即可
注文只针对古籍原书图像为双行小注、单行小注的文本进行标引为注文。
遇明显文字错误、标点错误,可改正。
点击打开自由编辑,可以删除/输入文字/标点、分段/回行 等,自由编辑书内容
一些常见问题:
错误示例
正确示例
书名应被标为正文,不要被标为卷
标题下的这种,作者信息,藏地信息,都标成 【说明信息】 哈。
避免标两个连续的卷标题/篇标题。 到阅读平台会被切成两卷/两篇。
原始标题错误断行
「目录」 内的内容,不要标标题。标正文和注文
案例
阅读平台效果:
「书名」 标为正文格式
标题不要留注文
这样标注,上线后,注文会归上一篇
卷尾的重复标题,要标成说明信息
标题较多的时候,可以打开目录看看是否是同一层级
标题中非常明显的标点错误,要改掉