Kindle」タグアーカイブ

Amazon Kindleで日本語表示研究 その2 – 本のスキャンを考える

KindleではPDFファイルに日本語フォントを埋め込めば、日本語の表示が可能なことはわかった。
将来のアップデートか新モデル、もしくは他の電子ブックリーダーが本体に視認性の高い日本語フォントを組み込み完全対応すれば、フォント埋め込み問題はどうにでもなる。
実際、今でもKindleのファームウェアをハックすれば、日本語の表示が出来る。

しかし、本棚にある本をどうするかという問題はそのまま残る。

文字数の少ない英語の書籍なら、スキャンしてOCRで認識すれば、99%以上の精度で文字として取り込めるだろう。
しかし、日本語の場合は90%行けばいいほうだ。個人的な感覚として95%程度の精度で文字を認識しても、まともに読めない。アルファベット系の言語と同等になるのは当分先だろうから、これは期待できないし、人力で修正するのは青空文庫などなら別で、個人でやるには限界がある。

ということで、日本語の書籍をデジタル化するのに現実的なのは画像として保存することだ。

KindleにPDFで画像化したファイルを表示

何も考えずに、高解像度でスキャンしたものをPDFに出力し、それをKindleで表示したのがこれである。
とりあえず読めるが、はっきり言って視認性は悪い。

Original

オリジナルの画像はこれで、青空文庫のデータを一般的な文庫本風にWordでレイアウトし、画像として出力した物だ。
これはスキャンの状態が非常によい場合という設定だが、これで視認性が悪いと言うことは問題だ。

視認性が悪くなるのは、細い文字をKindleで表示する際薄くなりすぎているからだが、これは白黒の電子ペーパーと、その表示機能などが問題なのだろう。
これを解消するにはデバイスその物の問題もあり簡単にはできない。そこで、画像をKindleの解像度に合わせて出力すれば、視認性も高くなるのではないかと考えた。

一般的な文庫本は300ページとかあるので、自動化しなければならないが、PhotoShopなどのマクロを使うなどやり方はいろいろあるが、現実的ではない。
専用のソフトを作るのが一番いいが、それを実践している人がいた。

No.722というサイトで公開しているChainLPというソフトだ。

このソフトを使えば、各種電子ブックリーダーや携帯端末用に、解像度やガンマ・レベル補正などを最適化したPDFや様々な形式のファイルが出力できる。
ものすごく利便性の高いソフトである。

これを使ってKindle用に出力し、Kindleで表示したのがこれ。

Kindle

Chain LP Amazon Kindle用TEST出力PDF

この表示には問題はないし十分読めるレベルになったが、PCでこのファイルをみると解像度が荒すぎて視認性が悪い。これで十分な方もいるだろうが個人的には不満である。
そこで、Kindleの2倍の解像度で出力したPDFをKindleで表示してみた。

Kindle x2

違いがわかりにくいが、こちらの方が若干ながら視認性は高い。PDFをPCなどで表示しても悪くない品質だ。
問題はファイル容量で、この1ページで500kb程度になる。Kindleに特化すれば140kb程度だ。
この差は大きくて、300ページの文庫本で換算すると42MBと150MBと3倍以上になる。
Kindleの容量は1.5GB程度あるので、150MBでも10冊保存できる。これでも十分だが、Kindleだけで読むことを考えると無駄ではなかろうか。

ということで、オリジナルの高画質版はPC用や将来の高品質な電子書籍用にとっておき、Kindle用をChainLPで作成するのがいいのではないかと考えた。

つづく

Amazon Kindleで日本語表示研究 その1

Kindleで日本語フォントを埋め込んだPDFを表示 無ハック

AmazonのKindle(キンドル)は、電子ペーパーを使った電子書籍表示デバイスである。
販売しているのはアメリカのAmazonで、利用できる言語は英語である。
インターフェースが英語なだけでなく、アルファベット系のフォント以外が入っていないので、日本語や中国語などは表示不可能。

Amazon.comで販売している商品はいろいろあるが、日本など海外に輸出できない物と出来る物がある。
KindleはAmazon.comが直接販売しない物で、日本で入手するには、米国で購入し、自分で輸入手続きするしかなかった。2009年秋より、International版とか国際版とか言われるGlobal Wireless版が登場し、日本など海外でAmazon.comから購入できるようになった。

今まで出来なかったのは、携帯電話の電波網を利用して書籍などを購入できる仕組みがあり、これが対応していなかったなどいくつかの理由がある。
この携帯電話網を利用した書籍の購入は、日本など、米国以外でも使えるようになった。米国以外で購入できるようになっても、対応言語は基本的に英語のみなのはかわらない。日本語の書籍も当然販売されていないので、洋書を読む方にはいいが、それ以外のほとんどの日本人にとって無用の長物だ。

そんなKindleがPDF表示に対応した。PDFに対応したKindleは画面サイズの大きいKindle DXがあったが、オリジナル版と同じ小型サイズのGlobal Wireless版もファームウェアのアップデートで対応した。

PDFが表示できると言うことは、画像として保存したPDFならどんなデータでも表示できる。つまり、日本語を画像として表示すれば問題なく表示可能だ。
また、PDFにはフォントを埋め込む機能があるが、KindleのPDF表示機能がこれに対応していれば日本語を表示できる。

結論から言えば、画像として文庫本などを取り込んでも、Kindle用に加工していなければ視認性はよくない。
PDFに埋め込んだ日本語フォントは問題なく表示できるが、フォントの選択そのものやサイズなどに工夫が必要となる。

つづく