❶ 实体书怎样转换成电子书
制作工具:
1.扫描仪
不一定是很好的扫描仪, 但最好是速度快一些的, 这样能省不少时间. 如果手头上宽裕的话还可以买能扫A3纸的扫描仪, 这样就能两页并作一页来扫.
2.OCR软件
FINEREADER, 这个软件及其破解在网络或狗狗可以找到. 此外它还带了不少语言包, 能识别很多种语言(汉语不理想,可以找找其它的,同方有个识别能力很强的). 建议多装几个语言包. (如果是制作PDF直接扫描,用XP自带的那个捕获工具就可以)
扫描前的准备工作:
1.打开电脑, 插上电源….这些废话就不多说了.
2.到Google上找一找看有没有你要扫的书的样章下载, 有得下当然要下啦, 那怕是一章也好
3.设置FINEREADER:
a)量一下书的尺寸, 选择TOOLS菜单中的OPTIONS选项, 切换到Scan/Open Image页, 单击Select Source…按钮选好你要用的扫描仪; 然后选中Use FineReader Interface, 记住不要选下面的”Display Options Dialog Before Scanning”. 接下来, 单击右边的Scanner Setting按钮, 将刚量好的书的尺寸填在这里. 这样当扫描到指定的位置时扫描仪就会折返, 而不用走完整个扫描仪的长度, 当然就又省了不少时间啦. 最后设定扫描间隔时间, 我一般设成两秒.
b)在跟上一步相同的界面中将扫描模式设为灰度, 300dpi. 如果采用黑白模式会使书中插图漆黑一团
c)大概翻一下你将要扫的书, 主要是看看里面有没有特殊的字符, 比如有些数学方面的书就有不少公式及其它怪怪的字符, 这时你就需要加装相应的语言包.如果你不想使用整个语言包, 也可以自己定义新语言, 这项工作是在Tools菜单的Language Editor…里面完成的. 完成语言包的加装只是完成了一半的任务, 为了让软件使用语言包或是你自己定义的语言, 还必须要告诉软件你需要用哪些语言来完成识别任务. 在工具栏上有一个下拉列表框, 默认值是English. 选中里面的Select Multiple Languages…在随后弹出来的对话框中勾选相应的语言. 语言的设置就完成了. (注:这个功能很少用到, 一般英语就足够了.)
d)单击Process菜单, 选中Start Background Recognition, 这样就能一边扫描一边辨认, 扫描结束后, 自动辨认也就结束了.
4.打开音箱, 音乐起, 开工喽
扫描及辨认中要注意的问题:
1.如果你的扫描仪不是超薄那种, 最好在扫描仪旁边放几本书, 高度跟扫描仪的高度一样, 这样扫书的时候, 书就不会往一边塌, 可以省不少力.
2.一些比较厚的书在扫到中间的时候, 书脊会向上拱起,需要用力按下去, 不然靠近书脊部分的文字会扭曲, 影响辨认效果. 一般来讲, 当扫到中间的时候可以经常性地将书往两边扯, 或是用力向后翻, 不过这样做对书的伤害是比较大的, 如果你是借朋友的书来扫,就不要这样干了, 小心被人扁; 如果是图书馆的书就无所谓了
3.目前还没有一款OCR软件能百分之百地辨认出书中的插图部分. 如果一个插图中有很中横线或直线, 它往往会把它当成是一个表格; 有时干脆不管三七二十一, 硬是把一张插图当成是文字来认. 遇到这种情况就只能是手工来指定辨认区域的类型了. 方法很简单, 选中垂直工具条上的图形区按钮, 在扫描得来的图形上画一个矩形框就行了.
4.只有在改变的文本辨认区域的大小或新增文本区的情况下,你才需要对一页重新进行辨认. 如果只是删除文本区, 或将文本区变成图形区, 则不用重新辨认.
5.FineReader对表格的处理也不错, 一般不需要对表格的辨认做什么改动. 如果你想增加或删除表格中的分隔线, 用垂直工具条上的想应按钮就行了, 改动的结果会立即显示出来, 不用再对该页进行辨认.
6.为了保证准确度, OCR结束后, 还需要进行一次拼写检查. 最常见的错误就是将l(小写的L)和1(阿拉伯数字), 0和O搞混淆. 如果你能发现一些规律的话, 比如很多r0被认成是rO, 可以使用替换功能, 一次过替换掉. 这样以后就不会再就错误提示了.
结语
以上只是我自己在制作扫描版电子书的时候的一些心得体会. FineReader是一款功能强大的软件, 有部分功能我还没用过, 比如Pattern Editor等. 希望此文能起到抛砖引玉的作用, 也希望它能对想要制作电子书的朋友一点点帮助.
制作扫描版的电子书是一个不小的工程, 要想制作高质量的电子书需要投入时间及精力, 但是当你完成一本电子书的制作时, 感觉就象是完成了一件杰作.
❷ 怎样把一本实体小说完整的用图片识别文字转成电子书
微信小程序搜索"识图者": 传图识字,文档识别,文字扫描,试卷,书籍,证件识别,拍照识别,图片文字识别,图片识别转文字word,动物识别,植物识别。
❸ 如何将实体书转化成可修改的电子书
可使用abbyy finereader对扫描后的图片进行ocr,不过很抱歉,中文的ocr识别率较低,错误率较高,因此需要手动修改的地方很多。英文的ocr识别率高。
❹ PDF的电子书是怎么通过实体书制作的
PDF电子书制作方法2:
1.原版电子档转换
其实,只有大陆地区才习惯将Word作为文档通用格式。其实真正的通用格式是PDF。电子书的通用格式也是PDF为主。现在的图书出版,普遍都是电脑排版,所以都有一个电子文档,就可以直接将这个电子文档按照出版格式制作成PDF格式,这才是标准的PDF电子书。这种电子书也很方便编辑,转化为其他格式。
2.旧图书的扫描
大量的旧版图书,由于没有电子文档,或者是原版已经没有了。为了节约时间,采用扫描或者是照片的形式,将图书每一页制作成图片形式,再制作成PDF。这样也就保持了“原汁原味”。但是这不是标准的PDF图书,只是利用了PDF的功能而已。这样的电子书只是一种PDF格式保存,想要编辑的话,需要OCR。所做的工作比制作pdf电子书还麻烦。
而且这种电子书,很多会折磨你的眼睛
❺ 怎样把实体书变成电子书
用扫描仪每页扫描一遍,用相机也行,但效果差点。
然后打开Adobe Acrobat 7.0 Professional或者9.0(因为我只用过这两个版本),菜单命令:文件-创建PDF-从多个文件,把你前面扫描的文件添加进来,点确定,最后保存就OK啦。
❻ 怎样将实体书转换成PDF文件存在电脑
可以直接扫描成图片PDF,但占用空间大
也可以用OCR软件把扫描图片转化成WORD,占用就小很多了
我用着赛酷OCR不错,速度快,正确率高
还有专家在线答疑,服务热情
网络一下,赛酷OCR
❼ 怎样将实体书变成电子书
三种方法:
1)打印,当然可以用书记员专用的那种打字机,很快的;或者花钱雇学生来打;
2)扫描成图片格式,虽然算不上电子书,但看起来也很方便;
3)用数码相机一页页拍下来(各人并不推荐这种方法,因为较麻烦);