PDFデータに記載された表形式の住所一覧。エクセルだったらいいのにと思うことはよくあります。Acrobat Proを使うことで割と簡単に実現できるついでに、このデータをGoogleマイマップに登録する方法を紹介します。
編集・コピーロックのかかったPDFのロック解除
今回は宇都宮市が販売している「宮の食べトクチケット」の加盟店一覧のPDFを例にロック解除します。
https://miyanotabetoku.jp/assets/download/toriatsukaiten_ichiran.pdf
PDFの店舗一覧。編集はおろか、文字情報のコピーまで制限されています。
しかしこの制限ははっきり言ってなんの意味もありません。
必要なのはGoogle Chrome。
ChromeでこのPDFを開き、右上の印刷ボタンを押します。
ここでプリンタではなく、PDFに保存を選択します。
つまりPDFデータをさらにPDFデータに再変換します。これだけ。
これだけでなぜか編集やコピーのロックは外れてしまいます。
Acrobat ProでExcelデータに変換
ロックを外したら、これをAcrobat Proで開きます。
開いたらメニューのファイルから書き出しでExcelブックを選んで書き出す、これだけでできるのですが、
データの内容によっては表が崩れてしまうことがあるので、先に必要な表だけをトリミングします。
Acrobatのツールから「PDFの編集」を選び「ページのトリミング」で表の部分だけをトリミングします。
和食や洋食等、複数の表があるのでジャンルごとに別々に保存していきます。
この状態でエクセルデータに書き出すと、下記のように不要な部分は含めず表のみの綺麗なデータに変換できます。
Googleスプレッドシートで正規表現を使ってデータを整形
このエクセルデータを今度はGoogleスプレッドシートで開きます。
理由は正規表現を使いたいから。エクセルでもできないことはないみたいですがめんどくさそうなので。
スプレッドシートで開き、店名と住所が3列になっていたので1列に直しました。
画像には入れ忘れていますが、1行目はラベルになるので、1列目に店名、2列目に住所と入れておきます。
Googleマップに登録した際に正確な場所を設定できるように、住所に都道府県と市町村名をつけます。
検索と置換から、検索欄には「(.*)」と入力し全ての文字列を検索します。
置換後の文字列には「栃木県宇都宮市$1」と頭に栃木県宇都宮市をつけて元の検索した文字列を後ろに付けます。
検索範囲はB列のみを指定し、完全に一致するセルを検索にチェックをいれます。
これで「田下町729-2」だけだった住所が「栃木県宇都宮市田下町729-2」と完全な住所に一括置換できました。
データによっては、住所や店名が2行に改行されていることがあるので、「\n」で検索し、置換後は空白にして改行を削除します。
Googleマイマップへインポート
Googleマイマップでスプレッドシートをインポートします。
マーカーを設置する住所の列を選択します。
マーカーの目印になる店名を選択します。
この時検索できない住所があるとリストアップしてくれるので、正確な住所を入力するか、Gooleマップのplus codeをコピペします。たまに正しい住所のはずなのに設定できない住所がありますが、建物名を消したり、数字を全角にしたりすることで設定できたりします。
ジャンルごとにレイヤーを作って、それぞれインポートしていけば完成です。
コメント