PDFにある表データをエクセルに変換したい、パソコンで仕事をしているとそんな場面がよくあります。そこでかなり正確にPDF内の表データをエクセル等のスプレッドシートに変換する方法を紹介します。
必要なアプリケーション
Adobe Acrobat Proが必要になります。
HiPDFのようなオンラインで無料でできるサービスもありますが、かなり精度が悪くまともに使えませんでした。
エクセルデータへの変換方法
まずはAcrobat ProでPDFを開きます。
こんかいはサンプルとして総務省統計局のサイトに掲載されていた下記のデータを使用してみました。
元データはかなりページ数が多いので、先にAcrobat Proで「ページを整理」→「抽出」で9ページくらいにある表が載っている「世界各国の人口及び人口増減率」という1ページだけ抜き出しました。
ファイルを開いたらメニューのファイルから書き出しでExcelブックを選んで書き出します。
保存したExcelを開いてみるとこのような感じで罫線に沿って正確にセルに区切られています。
罫線が入っていない列が一部結合してしまっていますが、ここまでできれば十分です。
コメント