20190505_キンドル書籍のepub化
読書の話題をもう一つ。
先日購入したペーパーバックの電子書籍がひどかった件。なんと全編スキャン画像。しかも中途半端な横向きの配置だったり、ページの一部が重複してコピーされているという…こんなの販売するのってどうなんだろうね。よっぽど僕のが良いもの作れるよ(怒)というものだった。
まぁ、ちゃんと中身検索で見てから買えよというところだけど、半額になってたので飛びついちゃったんだよね…もう、こんなのばっかり(苦笑)
でも、転んでもただでは起きない(笑)昨日は全部手打ちでなんとかしようと思ったんだけど、何ページあるかわからない英文をひたすらタイプしていくのはちょっとどうかと思い、せめて全文テキスト化をと思って色々と検索してみる。まずは、キンドルのファイルをいじれるようにしないとね。
参考になりそうなページとして選んだのはこちらのページ。
準備するものと簡単な流れが書いてあった。Kindle for PCのバージョンにも注意、と。ありがとうございます。
今回は縦書き関係ないからより簡単…のはずだったのだけど、エラーが(苦笑)KFXファイルがどうのこうの…って、出来ないんじゃん。
んー、じゃあ、ということで続いてKFXファイルの対処方法を検索…まぁ、いつものことだけど分かった単語を軸にひたすら検索(笑)たどり着いたのはこのページ。
今度は出来た。無事PDF化に成功。ありがとうございます!
いや、本当に検索って便利。若い人たちは検索を使わないと言われているみたいだけど、だまされないように使えはこんなに便利なものはないと思うけどね…って検索の話じゃなかった。
無事PDF化に成功したので、次は空白ページの整理。
なんと325ページ中45ページが空白のページ。何だそれ…本当にひどいなぁ。せっかく良さそうな内容の本なのに何だろうねこれ。
で、読み込んだページをテキスト形式で書き出そうと思ったら全く出来ない(苦笑)ただ改行が300行近く羅列されたテキストが吐き出されただけという…全ページ画像だから難しいかと思ったんだけど、やっぱりそのままじゃダメか。
やったことは、アクロバットの編集>テキストと画像の編集>スキャンした文書の中にある「テキストを認識」を選択して、その後に変換でテキストに書き出し。
1回目。30ページほどで挫折し、それ以降のページが空白になる。理由はわからん(ダメ)
2回目はページの整理で、全ページを選択してからやってみた。途中、日本語で認識するかということを聞かれたので、日本語ではなく、英語を選択する。おー。なんと、表示に何ページ変換したかが出るようになった。進行はめちゃくちゃ遅いけど、280ページまで進行状態を表示しているよ。で、無事終わりました。
吐き出されたファイルを見てみると、扱いにくい(涙目)
よし、こうなったら、PDFの時点で一旦編集だ。と思ったところで時間切れ。次の作業が入っています。残念。
ちょっと頭を冷やして再チャレンジの予定です。なんとなくだけど、やるべきことはわかってるんだからねっ。