2004年03月18日
地域ごとのGoogleヒット件数
Googleで地域検索を使っていると、空間にWebの雲が拡がっているような感じがだんだんしてくる、というような話をしていたら、その雲の厚さ(Googleのヒット数)は場所によって全然違うのでは?と指摘された。
俄然興味が湧き、とりあえず市区町村別にヒット数を調べ、市区町村ごとの緯度経度地点に棒グラフでプロットしてみた。検索語句は「東京都 "千代田区"」という感じ。
(->PDF)
確かに、全然違う。棒グラフの長さがほとんどないように見えるところがたくさんある一方、都市部の長さは突出している。都市部の棒グラフの「密度」が高いのは市区町村の数が多いためだが、密度が高い上にそれぞれそれなりの件数がある。
すげー格差が大きいよ、所詮都市部に集中してるんだよという感じだが、これを人口あたりのヒット数にしてみると
(-> PDF)
こんな感じになり、絶対数ほど格差は大きくない。わりと平凡な絵。
とは言っても、日本一の千代田区は約17件/人なのに対して、一番低いところは0.0114件/人しかない。1500倍近い(一番と一番だけで比べるのは良くないけど、面倒くさかったので)。絶対数で一番件数が多いのは、東京都新宿区で1140000件。
ところで、世界中から検索されまくるGoogleにとってはこれくらいどうってことないんだろうけど、一気に検索するのはいくらなんでも気が引けたので、間隔を空けて検索を繰り返すようなスクリプトを書いた。
東京の町ごとに調べるのも面白そうだ。
やってる過程で気がついたこと。
Webページに住居表示を含んでいるものは、やはり圧倒的に商業関係が多いので、これはそういう偏りを含んだ結果である。
人口あたりの検索結果数を出すところでエラーが出て止まったのでなんだろうと思って見てみたら、0で割ろうとしていた。つまり人口が0。人口は平成12年の国勢調査から持ってきているのだが、その中で人口が0の市区町村はただ一箇所、東京都三宅村。
一つ飛び抜けてヒット件数が少ないところがあった。たった2件。ほとんどは少なくとも数千件はあるのでこれは異様。よく見たら「岐阜県加茂群富加町」。郡の字が間違っている。これは街区レベル位置参照情報が間違っていた。
追記 (2004-06-24):現在はGoogleの動作が変わったので、検索語をダブルクォートでくくるとおかしなことになる。
Posted by jiro at 2004年03月18日 17:56 | トラックバック (2)なるほど。
WWW空間の可視化ってのは,ひとつの研究ジャンルになっています。
ここでやっている位置情報と密接にリンクしたWWW空間の可視化っていうのは,かなり新しいのではないかと思われます。(ちゃんと先行研究を潰していないので断言できないけどさ。)論文書くべし。
Googleへの遠慮がちな検索,いつごろ一式終わりますか?
検索に時間がかかると,その間にWWW世界が変化してしまうという問題はあるわな。
Posted by: もとえ at 2004年03月19日 01:19いまのところ街区レベル位置参照情報に含まれる市区町村単位でしか試してないので、2600件くらいだったかな?それくらいしかないので、数秒空けても数時間で終わります。
でも、その間でも件数は変わりますね。っていうか、ほぼ同時に全く同じ検索をしても結果にはバラツキがあります。11000件になったと思ったら13000件、すぐにまた11000件、みたいな感じで。
Posted by: もとなが at 2004年03月19日 02:12Google Local だってよ。
http://www.itmedia.co.jp/news/articles/0403/18/news015.html
プレスリリースがあっただけでまだ公開されていないのか,到達できませんでした。
Posted by: もとえ at 2004年03月19日 02:21あらま。
コンテストグランプリ受賞作の成果が出た訳ですな。
地図上に表示するみたいで、それはすげー。
よーし、こっちはGPS連係と方角分けで。
端末の前で検索するのと実空間の違いを打ち出していかないと。
つーか、みんな考えることは一緒ですなー
Posted by: もとなが at 2004年03月19日 02:35まちの検索家。
都市空間の検索者。
微妙に寺山修司風だな(笑)
カーナビに実装してもいいと思うんだけど,カーナビのカスタマイズってあんまり聞かないですね。
Posted by: もとえ at 2004年03月19日 08:58道を走りながら、どんどん文字が流れていく。3Dで。って話は、ULSEの初期構想の中でも出てました。
カーナビのデータを使えば、都市計画地域なんてセコい事言わなくて済みますね。
ヒット件数も、都市計画区域内に限定しなければもっと面白い結果が出るんじゃないかと思ってます。観光ものの情報とかは、全然人が住んでないところにあることも多いので、人口あたり件数で都市部と逆転する可能性もある。
>あんまり聞かないですね
そりゃ、カーナビはプロプラの最たるものですから。
Posted by: もとなが at 2004年03月19日 15:54ヒット数を人口で割るってのもよく分かんない計算ですよね。
なんとなく関係がありそうななさそうな数字で割ってみただけ。
そしたら平らになった。なるほど二つは関係あるのかも。
そんなんでいいのか(笑)