CSV アドレス マッチング サービス

初めてご利用の方は下記の説明をご覧ください。すぐにサービスを利用される方はこちらから

サービス概要

本サービスは、住所・地名フィールドを含むCSV形式(*1)データにアドレスマッチング処理(*2)を行い、緯度経度または公共測量座標系の座標値を追加します。本サービスで座標値を付加したファイルをGISで読み込めば、下のような地図を作成することもできますし、様々な空間解析を行なうこともできます。本サービスの具体的な利用方法については、チュートリアルをご覧下さい。

大学一覧の所在地を地図にする例
  • *1 CSV形式 とは
    1行に1つのレコードがあり、レコード内の各フィールドがカンマで区切られたテキストファイルのデータフォーマットです。ほとんど全てのデータベース管理ソフトや表計算ソフトで出力することができますし、テキストエディタを使って作成や修正をすることもできます。
CSVファイルの例:東京23区の大学一覧
"名称","所在地","代表電話番号"
"東京大学","文京区本郷7-3-1","03-3812-2111"
"早稲田大学","新宿区戸塚町1-104","03-3203-4141"
"慶應義塾大学","港区三田2-15-45","03-3453-4511"
"明治大学","千代田区神田駿河台1-1","03-3296-4545"
"立教大学","豊島区西池袋3-34-1","03-3985-2231"
"法政大学","千代田区富士見2-17-1","03-3264-9308"
  :        :         :
  • *2 アドレスマッチング とは
    住所を含んでいるデータをGISで扱うために、緯度経度のような数値による座標値を与える処理のことです。より厳密には「アドレスジオコーディング」と呼ばれることもあります。アドレスマッチングは、それぞれのレコードの住所部分を見て、地図から該当する住所を見つけ、その座標値をレコードに付加するという処理を繰り返すことで実現できます。本サービスは、このアドレスマッチングをインターネット経由で行ないます。

チュートリアル

まず、サンプルとして次のCSVファイルを利用します。試してみたい場合はダウンロードして下さい。

サンプルCSVファイル:sample.csv

サンプルCSVファイル

次にCSVアドレスマッチングサービスのページを開き、「パラメータ設定」の各欄に次のように入力します。各パラメータの意味については、設定パラメータを参照してください。

  • 対象範囲:東京都 街区レベル(経緯度・世界測地系)
  • 住所を含むカラム番号:4
  • 入力ファイルの漢字コード:自動設定
  • 出力ファイルの漢字コード:(未指定)
  • 出力ファイルのフォーマット:csvフォーマット
  • オプション:デフォルトのまま(「x,yを反転」はチェック無し、「部分一致を探す」)
  • 変換したいファイル名:(参照ボタンを押して、ダウンロードしたサンプルCSVファイルを選択してください)

全て入力したら「送信」ボタンを押してください。サンプルCSVファイルがサーバに送信され、アドレスマッチングが行なわれます。しばらく待つと「ファイルのダウンロード」が表示されますので、適当な名前で保存してください。

  • 送信ボタンを押してからダイアログが表示されるまでの時間は、ネットワークの状態により、数秒から数分かかることがあります
  • 5分待っても応答がない場合はネットワークの不調と思われますので、しばらくしてからもう一度試してみてください

保存したファイルはCSV形式です。メモ帳などのテキストエディタやExcelなどの表計算ソフトで開くことができます。実行に成功していれば、次のような結果が得られます。

東京都立航空工業高等専門学校,03-3801-0145,116-0003,東京都荒川区南千住8-52-1,"東京都/荒川区/南千住/八丁目/52番","139.80946","35.73363","5","7"

変換結果

4カラム目まではもとのファイルと同じです。5カラム目の「東京都/荒川区/南千住/八丁目/52番」は、もとの4カラム目にあった住所に一致した(と判断された)住所です。この例では、「8-52-1」という部分が「八丁目52番」と解釈されています(「1」が「1号」になっていないのは、辞書として利用している「街区レベル位置参照情報」にそこまで細かい情報が記載されていないためです)。

6カラム目と7カラム目の「139.80946」、「35.73363」は、「東京都荒川区南千住八丁目52番」という住所で表される範囲を代表する点の経度と緯度です。パラメータ設定の対象範囲に「東京都 街区レベル(公共測量座標系・世界測地系)」を選択すれば、この部分に公共座標系のX、Yの値(*3)がそれぞれ入ります。

*3 公共測量座標系のX, Yは、東西方向がY、南北方向がXとなります

8カラム目の「5」という数字はこの変換結果が十分信用できることを、9カラム目の「7」という数字は街区・地番レベルの精度であることを意味しています。詳細は「変換結果のiConf, iLvlとは何ですか?」を参照してください。

あとはGISでこの結果ファイルを開き、Xの値として経度のカラムを、Yの値として緯度のカラムを指定してポイントデータとして読み込めば、地図上に表示することができます。座標値を含むCSVファイルをポイントデータとして読み込む方法はGISによって異なります。たとえばArcGISの場合はこちらを、 QGIS の場合はこちらを参考にしてください。

設定パラメータ

本サービスでは、6つのパラメータで変換の方法を指定します。ここではそれぞれのパラメータの意味を説明します。

対象範囲

アドレスマッチングを行なうには、地図から作成した住所と座標値の対応表を利用する必要があります。このパラメータでは利用する対応表を選択します。地域や座標系もここで選択します。

  • 全国街区レベル(経緯度・世界測地系)
    現在もっとも一般的な選択肢で、日本全国の住所をGPSなどで利用されている経緯度に変換します。ほとんどの場合はこの選択肢で問題ありません。
  • 全国街区レベル(経緯度・旧測地系)
    西暦2000年より前に日本で広く利用されていた経緯度に変換します。カーナビ用地図などではまだこちらの座標を使っている場合があります。
  • 全国街区レベル(公共測量座標系・世界測地系)
    公共測量座標系は平面直角座標系とも呼ばれる、地表を平面に投影した座標に変換します。角度ではなくメートルで表すので分かりやすいですが、範囲が広くなると歪むため、日本全国が19個の「系」に分割されます。詳細は国土地理院の説明を参照してください。変換結果には系の番号は入っていませんので注意してください。
  • 都道府県別・街区レベル(経緯度・世界測地系)
    CSVの住所が町名から始まっているような場合、同じ名前の町が他の都道府県に存在することがあり、誤変換の原因になります。どの県のデータか分かっている場合、都道府県別を選択することでこの問題を回避できます。
  • 都道府県別・街区レベル(経緯度・旧測地系)
    上と同じですが結果は旧測地系になります。

住所を含むカラム番号

CSVファイルの何カラム目に住所が含まれているかを指定します。先頭のカラムを1とします。住所が複数のカラムに分かれている場合、全てのカラムを住所の順番どおりに指定してください。

例として、次のようなレコードを持つCSVファイルを考えてみます。

東京大学,東京都,文京区,本郷,7-22-1,113-8654

このデータでは、住所が2カラム目から5カラム目までに分割されています。このような場合には、「2,3,4,5」のようにカンマで区切って、全てのカラム番号を列挙してください(「2-5」のようなハイフンによる表記は認識しません)。

入力ファイルの漢字コード

CSVファイルの漢字コードを指定します。WindowsやMacではシフトJISコードが使われますが、UNIXで処理したデータなどには拡張UNIXコード(EUC)やJISコードのファイルがあります。

通常は「自動設定」で問題ありませんが、CSVファイルの1行目に漢字が含まれていなかったり、半角カナが含まれている場合などには正しく認識できないことがあります。そのような場合には、明示的に漢字コードを指定してください(UTF-8は「BOMなし」のみ対応しています)。

出力ファイルの漢字コード

結果として返すファイルの漢字コードを指定します。通常は「入力ファイルと同じ」で問題ありませんが、UNIXで作成した拡張UNIXコードのファイルを入力し、結果をWindows上のGISソフトで利用するためシフトJISコードで出力したいという場合などには、明示的に漢字コードを指定してください。

マッチングオプション

  • x,yを反転(チェックボックス)
    公共測量座標系では経度方向がY軸に、緯度方向がX軸となっているため、GISによってはxとyの値を入れ替える必要があります。このような場合にはこのチェックボックスをチェックしてから変換してください。
  • 部分一致の探索
    部分一致を「探す」に設定した場合、先頭から最も長く一致する住所を返します。「探さない」に設定した場合、末尾まで完全に一致しない限り返しません。たとえば「東京都目黒」を変換した時、「探す」に設定すれば「東京都目黒区」を、「探さない」に設定すれば「東京都」を返します。ただし、「ー(ハイフン)」で省略されている場合には末尾まで一致していると見なしますので、「東京都目黒区駒場4ー」はいずれの場合でも「東京都目黒区駒場四丁目」に変換されます。
    市町村名までは完全一致のみを返し、町字以下は部分一致を認める場合には「町字以下で探す」に設定してください。同様に、町字までは完全一致のみを返し、丁目以下は部分一致を認める場合には「丁目以下で探す」に設定してください。
  • 変換したいファイル名
    入力するCSVファイルのファイル名を指定します。半角カナや全角文字を含むファイル名は処理できない場合がありますので、半角アルファベットを用いるようにしてください。

利用条件

本サービスはできる限り自由に広く利用して頂きたいと考えておりますが、利用に際しては以下の条件を守ってください。

  1. 本サービスは、法律や条令に反する目的では利用できません。
  2. 本サービスの結果を利用することによってなんらかの損害が生じた場合でも、いかなる賠償責任も負いかねます。利用者責任でご利用ください。
  3. 本サービスはメンテナンスなどのため、無断で停止する場合がありますので、あらかじめご了承ください。

以下は想定される正しい利用例です。

  • 変換結果を用いて学術研究を行い、結果を論文等に投稿したり、Web上で公開する
  • 教育目的で変換結果を地図にして印刷し、学生・生徒に配布する
  • 自己責任においてマーケティングなどの商用目的で利用する
  • 地方自治体などで日常業務に利用する

以下は正しくない利用例です。

  • 防災システムなどサービスの停止が人命に関わる目的で利用する
    • 本サービスがメンテナンス等で停止した場合に、重大な問題を引き起こす恐れがあります
  • 違法な商行為で利用する/不法に取得した個人情報から地図を作成する
    • どのように利用されているか監視しているわけではありませんので、本サービスが不法行為に利用されていることが明らかになれば、サービス自体を終了することになります
  • 本サービスを内部で二次的に利用するシステムを開発し、顧客にそのことを説明せずに提供する
    • 住所を入力する利用者が、セキュリティやネットワークリスクを想定せずに本サービスを利用することで、個人情報漏洩や機密漏洩につながります

補足

本サービス開発者が Python 版のジオコーダ jageocoder、および CSV アドレスマッチングと同等の機能を持つサーバ jageocoder-server を GitHub 上でオープンソースとして公開しています。

アプリケーションやサービスにジオコーディング機能を組み込みたい、あるいはセキュリティ上の理由などにより自組織内でアドレスマッチングサービスを運用したいという場合にはお試しください。