2004年03月13日
街区レベル位置参照情報
(2006-03-11記:街区レベル位置参照情報についてのアンケート(SSL版)(非SSL版)というものが3月23日まで行われているそうです。)
街区レベル位置参照情報とは、全国の都市計画区域を対象に、街区単位(「○○町△丁目□番」)の位置座標(代表点の緯度・経度、平面直角座標)を整備したデータです。
ちょっと使い道を思いついたので、ダウンロードしてデータベースに入れてみた。
思いついたこと→Googleで地域検索
ある場所の、周囲の地名を知りたいことがよくある。例えば地名をもとに検索する場合、周囲の地名もあわせて検索できたほうが実用的な情報が手に入る可能性が高くなる。歩いて3分の隣町の名前がわからないというだけで、見落とす情報があるのは悲しい。
また、キーワード+位置で検索すると、ちょっとどうかと思うようなアバウトな検索でもそれなりの結果が返ってくるようになる。例えばどこで食事をしようか、という場合、キーワード「おいしい」で普通に検索してもまともな結果にはならないが、これに位置が加わるだけで意外なほど使える情報になる。
データを整形してる過程でわかったこと。
全街区数は16166881。
つまり、日本の住所は「日本一丁目16166881番地△号」で表せる。(都市計画区域内だけだけど)
日本一長い市区町村名は「西春日井郡西枇杷島町」
日本一長い地名は「愛知県海部郡飛島村大字飛島新田字竹之郷ヨタレ南ノ割」
なぜかどっちも愛知県だ。
1600万件もあるデータベースを作ったのは初めて。最初何も考えずにフラットに一つのテーブルに突っ込んだら1.6GBとかになった。都道府県名と市区町村名は別テーブルを参照するようにしたら1GBちょっとになった。インデックスのファイルは1GB近く。
データベースの勉強をもっとしないとなー。
街区レベル位置参照情報に含まれる市区町村名にはやや揺れがある。「湯布院町」と「大分郡湯布院町」が同じ市区町村コード。悩んだが、とりあえず郡を含むものと含まないものの二種類のテーブルを作っておいた。