スポンサード リンク
PDFをオフィス形式ファイル(doc、xls、rtf など)に逆変換する場合、元のPDFが主にテキスト主体ならほぼ上手くいきますが(元のPDFとそっくりなdoc(など)に変換される)、テキストと画像が複雑に入り混じったPDFや、文字の大きさ・色がさまざまなPDF、段組や表が複雑に使用されているPDFの場合、変換しても、段組が大きく崩れたり、テキストが文字化け風に変換されてしまったりする事もあり、なかなか一筋縄では行きません。
PDFをオフィス用ファイル に逆変換したいということは、文書の内容を再利用・編集したいからだと思うのですが、PDFには大雑把に言うと
-
テキスト情報(+線画・画像)主体のPDF (ワードなどから作成したもの)
-
画像系のPDF (写真・イメージ・スキャナから取り込んでテキスト情報の無いもの)
があります。一見同じPDFに見えますが、文字を編集する場合、
■
テキスト主体(+画像)系のPDF(ワードなどから作成したもの)はテキストデータが含まれているので、テキストファイル(txt)には容易に変換できますし、MSオフィス形式ファイルなどに変換する場合も、段組を再現するとき多少崩れることはありますが、だいたい元のPDFと似たような感じに変換されます。
ただし、フリーソフトではめぼしいものは有りません。有料ではいろいろ
良さそうなものがあります。全て試したわけではありませんが、値段相応と思われます。
■画像系のPDFは一度、画像から文字情報を認識しなければなりません。
それが
OCR (Optical Character Reader【光学式文字読取】)で、そのソフト(の日本語用)は開発に相当なコストがかかるためか、フリーソフトでは現在
ありません ほとんどありません。
フリーソフトのPDF XChange Viewer(無料版)はOCR機能がありますが、認識率が悪く実用には難があります。【参考リンク:
OCR 精度の比較 無料版と有料(製品)版】
OCR ソフトは、商用では『読んde!!ココ』や、『読取革命』など、数種類、一万円前後まででもありますし、スキャナを買うと簡易版が付属してくることもあります。それらのソフトではワード・エクセルへの変換も、まず満足できるレベルで可能です。
■
ちょっと古いですが、コチラなども参考にしてみてください。
PC Online【記事】:
PDFをOffice文書に逆変換
スポンサード リンク
PR