结构整理环节帮助文档结构整理环节帮助文档

环节目标:标题完整且层级正确;分段恰当。
1. 检查目录,修改标题格式
根据标题的层级,修改为对应的格式。

2. 检查分段,保证正确分段,无异常断行。 对超长段落进行切分。

操作时长建议:每卷 5-15 分钟
快捷键:
卷 Alt+1
篇 Alt+2
章 Alt+3
节 Alt+4
小节 Alt+5
说明 Alt+S
正文/注文 Alt+Z
撤销:Ctrl+Z
恢复:Ctrl+Alt+Z
断行检查:Alt+K
保存:Ctrl+S
书体格式整理示例
标题
修改方式:选中标题内容,点击工具栏,或使用快捷键,修改为正确的格式


原图样例
说明
整理效果

四层标题 :卷、篇、章、节、小节一卷仅有一个卷标题,其他标题按内容层级依次设置


古籍一般用缩进表示标题层级。这个缩进如果被 OCR 识别为空格,是不需要保留的


卷标题,在同一行

段落
整体上依从原书分段。
原图样例
说明
整理效果

破段:连续的文本 被错误的断行切开,应该合并段落。可以使用断行检查:Alt+K 快速查找不当断行


诗歌工整即可,一般按照每 4 句分一段。古籍常用空格表示诗歌断句,在 OCR 识别时,会识别为空格。这个空格不需要保留,删去即可。


【道藏】 为表示对神灵、皇帝的尊崇,古籍原始刻本遇到 「天尊」「圣上」 等称号,会另起一行。此种情况应悉数合并段落


书籍结尾会重复一下书名,但原始很多会将这个书名没有区分段落,需要进行段落区分。


超长段落遇超长段落 (5 行以上),可根据理解拆分 (不强制)

说明信息
原图样例
说明
整理效果

说明信息一般位于标题后。此处的作者、时间等,当作说明信息

正文/注文
原图样例
说明
整理效果

卷前扉页信息处理成连续正文即可


注文只针对古籍原书图像为双行小注、单行小注的文本进行标引为注文。

遇明显文字错误、标点错误,可改正。

点击打开自由编辑,可以删除/输入文字/标点、分段/回行 等,自由编辑书内容

一些常见问题:

错误示例
正确示例
书名应被标为正文,不要被标为卷


标题下的这种,作者信息,藏地信息,都标成 【说明信息】 哈。


避免标两个连续的卷标题/篇标题。 到阅读平台会被切成两卷/两篇。


原始标题错误断行


「目录」 内的内容,不要标标题。标正文和注文
案例

阅读平台效果:

「书名」 标为正文格式


标题不要留注文

这样标注,上线后,注文会归上一篇

卷尾的重复标题,要标成说明信息


标题较多的时候,可以打开目录看看是否是同一层级


标题中非常明显的标点错误,要改掉