❶ 實體書怎樣轉換成電子書
製作工具:
1.掃描儀
不一定是很好的掃描儀, 但最好是速度快一些的, 這樣能省不少時間. 如果手頭上寬裕的話還可以買能掃A3紙的掃描儀, 這樣就能兩頁並作一頁來掃.
2.OCR軟體
FINEREADER, 這個軟體及其破解在網路或狗狗可以找到. 此外它還帶了不少語言包, 能識別很多種語言(漢語不理想,可以找找其它的,同方有個識別能力很強的). 建議多裝幾個語言包. (如果是製作PDF直接掃描,用XP自帶的那個捕獲工具就可以)
掃描前的准備工作:
1.打開電腦, 插上電源….這些廢話就不多說了.
2.到Google上找一找看有沒有你要掃的書的樣章下載, 有得下當然要下啦, 那怕是一章也好
3.設置FINEREADER:
a)量一下書的尺寸, 選擇TOOLS菜單中的OPTIONS選項, 切換到Scan/Open Image頁, 單擊Select Source…按鈕選好你要用的掃描儀; 然後選中Use FineReader Interface, 記住不要選下面的」Display Options Dialog Before Scanning」. 接下來, 單擊右邊的Scanner Setting按鈕, 將剛量好的書的尺寸填在這里. 這樣當掃描到指定的位置時掃描儀就會折返, 而不用走完整個掃描儀的長度, 當然就又省了不少時間啦. 最後設定掃描間隔時間, 我一般設成兩秒.
b)在跟上一步相同的界面中將掃描模式設為灰度, 300dpi. 如果採用黑白模式會使書中插圖漆黑一團
c)大概翻一下你將要掃的書, 主要是看看裡面有沒有特殊的字元, 比如有些數學方面的書就有不少公式及其它怪怪的字元, 這時你就需要加裝相應的語言包.如果你不想使用整個語言包, 也可以自己定義新語言, 這項工作是在Tools菜單的Language Editor…裡面完成的. 完成語言包的加裝只是完成了一半的任務, 為了讓軟體使用語言包或是你自己定義的語言, 還必須要告訴軟體你需要用哪些語言來完成識別任務. 在工具欄上有一個下拉列表框, 默認值是English. 選中裡面的Select Multiple Languages…在隨後彈出來的對話框中勾選相應的語言. 語言的設置就完成了. (注:這個功能很少用到, 一般英語就足夠了.)
d)單擊Process菜單, 選中Start Background Recognition, 這樣就能一邊掃描一邊辨認, 掃描結束後, 自動辨認也就結束了.
4.打開音箱, 音樂起, 開工嘍
掃描及辨認中要注意的問題:
1.如果你的掃描儀不是超薄那種, 最好在掃描儀旁邊放幾本書, 高度跟掃描儀的高度一樣, 這樣掃書的時候, 書就不會往一邊塌, 可以省不少力.
2.一些比較厚的書在掃到中間的時候, 書脊會向上拱起,需要用力按下去, 不然靠近書脊部分的文字會扭曲, 影響辨認效果. 一般來講, 當掃到中間的時候可以經常性地將書往兩邊扯, 或是用力向後翻, 不過這樣做對書的傷害是比較大的, 如果你是借朋友的書來掃,就不要這樣幹了, 小心被人扁; 如果是圖書館的書就無所謂了
3.目前還沒有一款OCR軟體能百分之百地辨認出書中的插圖部分. 如果一個插圖中有很中橫線或直線, 它往往會把它當成是一個表格; 有時乾脆不管三七二十一, 硬是把一張插圖當成是文字來認. 遇到這種情況就只能是手工來指定辨認區域的類型了. 方法很簡單, 選中垂直工具條上的圖形區按鈕, 在掃描得來的圖形上畫一個矩形框就行了.
4.只有在改變的文本辨認區域的大小或新增文本區的情況下,你才需要對一頁重新進行辨認. 如果只是刪除文本區, 或將文本區變成圖形區, 則不用重新辨認.
5.FineReader對表格的處理也不錯, 一般不需要對表格的辨認做什麼改動. 如果你想增加或刪除表格中的分隔線, 用垂直工具條上的想應按鈕就行了, 改動的結果會立即顯示出來, 不用再對該頁進行辨認.
6.為了保證准確度, OCR結束後, 還需要進行一次拼寫檢查. 最常見的錯誤就是將l(小寫的L)和1(阿拉伯數字), 0和O搞混淆. 如果你能發現一些規律的話, 比如很多r0被認成是rO, 可以使用替換功能, 一次過替換掉. 這樣以後就不會再就錯誤提示了.
結語
以上只是我自己在製作掃描版電子書的時候的一些心得體會. FineReader是一款功能強大的軟體, 有部分功能我還沒用過, 比如Pattern Editor等. 希望此文能起到拋磚引玉的作用, 也希望它能對想要製作電子書的朋友一點點幫助.
製作掃描版的電子書是一個不小的工程, 要想製作高質量的電子書需要投入時間及精力, 但是當你完成一本電子書的製作時, 感覺就象是完成了一件傑作.
❷ 怎樣把一本實體小說完整的用圖片識別文字轉成電子書
微信小程序搜索"識圖者": 傳圖識字,文檔識別,文字掃描,試卷,書籍,證件識別,拍照識別,圖片文字識別,圖片識別轉文字word,動物識別,植物識別。
❸ 如何將實體書轉化成可修改的電子書
可使用abbyy finereader對掃描後的圖片進行ocr,不過很抱歉,中文的ocr識別率較低,錯誤率較高,因此需要手動修改的地方很多。英文的ocr識別率高。
❹ PDF的電子書是怎麼通過實體書製作的
PDF電子書製作方法2:
1.原版電子檔轉換
其實,只有大陸地區才習慣將Word作為文檔通用格式。其實真正的通用格式是PDF。電子書的通用格式也是PDF為主。現在的圖書出版,普遍都是電腦排版,所以都有一個電子文檔,就可以直接將這個電子文檔按照出版格式製作成PDF格式,這才是標準的PDF電子書。這種電子書也很方便編輯,轉化為其他格式。
2.舊圖書的掃描
大量的舊版圖書,由於沒有電子文檔,或者是原版已經沒有了。為了節約時間,採用掃描或者是照片的形式,將圖書每一頁製作成圖片形式,再製作成PDF。這樣也就保持了「原汁原味」。但是這不是標準的PDF圖書,只是利用了PDF的功能而已。這樣的電子書只是一種PDF格式保存,想要編輯的話,需要OCR。所做的工作比製作pdf電子書還麻煩。
而且這種電子書,很多會折磨你的眼睛
❺ 怎樣把實體書變成電子書
用掃描儀每頁掃描一遍,用相機也行,但效果差點。
然後打開Adobe Acrobat 7.0 Professional或者9.0(因為我只用過這兩個版本),菜單命令:文件-創建PDF-從多個文件,把你前面掃描的文件添加進來,點確定,最後保存就OK啦。
❻ 怎樣將實體書轉換成PDF文件存在電腦
可以直接掃描成圖片PDF,但佔用空間大
也可以用OCR軟體把掃描圖片轉化成WORD,佔用就小很多了
我用著賽酷OCR不錯,速度快,正確率高
還有專家在線答疑,服務熱情
網路一下,賽酷OCR
❼ 怎樣將實體書變成電子書
三種方法:
1)列印,當然可以用書記員專用的那種打字機,很快的;或者花錢雇學生來打;
2)掃描成圖片格式,雖然算不上電子書,但看起來也很方便;
3)用數碼相機一頁頁拍下來(各人並不推薦這種方法,因為較麻煩);