专栏名称: 蓝拿的钱币公会
这既是一个专门分享钱币探索乐趣的订阅号,也是一个实用的钱币知识平台。蓝拿的钱币公会推崇原始互助的知识分享精神,如果你真正热爱钱币,愿意分享自己的知识,你就是钱币公会的同道中人。
目录
相关文章推荐
中核集团  ·  卓越绩效大家谈⑥ ·  11 小时前  
中核集团  ·  开开开开开工! ·  2 天前  
中核集团  ·  校园招聘🤩 ·  3 天前  
51好读  ›  专栏  ›  蓝拿的钱币公会

干货技术:钱币图书数字化处理方案(一)

蓝拿的钱币公会  · 公众号  ·  · 2019-08-06 11:27

正文

好长时间不更新了,原因无他,唯稿件积压成山尔。日更的话,绝对和我的写稿任务有冲突,而且我又不可能像某些公众号一样,天天发什么钱币鸡汤文。我当然也写过垃圾文,但我不会发在这个公众号上,所以不会天天推送文章。


今天和后续几天推出的钱币图书数字化处理方案专题稿,之前从没有人涉及过,大概以后也不会有人再完善,而且据我估计,能看完全文的人,也不会按照文章里说的去做。那么,我为啥要写这个专题?其实也简单,这算是我在学习知识的一个阶段性经验的总结。至于读者爱不爱看,或者能不能看懂,于我毫无影响,因为我运营这个公众号,没有任何收入,自然不需要讨好任何人。


今天先讲理论部分


电子书有好多种形式,但今天我要谈的是由实体书扫描制作的电子书,时髦的说法就是“图书数字化处理”。


为什么要制作电子书?因为电子书方便查看,而全文可复制是对电子书的基本要求。


搞外币的人都会点英语,但法语、德语、意大利语、俄语呢?抱歉,鄙人尚未见到钱币界有通晓多国语言的牛逼之人,好多人都说克劳斯目录是垃圾,但能有几个人会去看各国的本土目录呢?即使有本土目录,但看不懂文字,那也和文盲买书没有区别。


所以,对图书的数字化处理,就是文献查阅者目前的最优解。别说什么依靠粘贴文字用谷歌翻译不如学一门外语,有那个时间和精力,你当初为啥不考清华北大哈佛?(考上的别和我抬杠,谢谢)


我做的电子书,全文可复制


图书数字化处理的基本要求


那么,由实体书制作的电子书,要符合什么标准呢?


第一,确保图像清晰,因此扫描设置不能低于300DPI,当然高了也没什么用,600DPI是一般机器的扫描设置上限,只有在扫描地图和画册时才会用到。


第二,确保图像修复质量达标。由于是扫描,成书时不可避免会遇到很多尴尬的情况:比如图像歪斜、图像边缘有阴影、图像上有杂物、图像有污渍等等,这些问题都要及时解决,除此之外,还要保证所有的图像按统一的尺寸裁剪。


扫描原图,中缝处阴影清晰可见


第三,整本书可全文复制。这一步在扫描之后,是通过OCR技术来实现的。未经OCR而发布的电子书,只能称为“扫描版”。


第四,制作书签。电子书的书签是用来快速定位的,这是一本完整的电子书必备的功能。


第五,压缩体积。其实这个不是硬性标准,不压缩,电子书的图像质量更好,而且几百MB体积的电子书,根本不算什么事。如果压缩的话,要在源图像基础上进行压缩。


第六,保存格式为PDF/A文档。这种格式与PDF的区别是,PDF/A文件不要求任何附加的外部信息才能适当地显示。但是,此种格式排除了某些在诸如电影、音响和透明纸等标准PDF文件中的功能。我个人觉得,PDF/A格式的阅读流畅性更好(也许是错觉)。


什么样的书适合数字化处理?


如果拆书扫描,任何书都适合扫描,但我要谈的是:什么书不拆书而适合扫描。


第一,可以摊开平扫的书。平扫的书,中缝阴影可以通过裁剪手段去除,但这种书基本都是400页上下。


第二,不能摊开平扫的书。中缝和正文间距不能低于11毫米,这个距离要求受限于市面上流行的所谓“零边距”扫描仪,说是零边距,其实是短边距。而即使是零边距,书也不能完全贴合扫描面,除非拆书。

看右边,中缝和正文之间本来有11毫米的空白间距


图书数字化处理需要哪些工具?







请到「今天看啥」查看全文