[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

歴史的行政区域データセットβ版 | Geoshapeリポジトリ

市区町村を探すには、「市区町村のリストから探す」、「市区町村の一覧地図から探す」、「市区町村名を入れて検索する」という3つの方法があります。

市区町村のリスト

  1. 標準地域コード 一覧 - 現在の行政区域のみのリスト
  2. 市区町村ID 一覧 - 過去の行政区域も含むリスト
  3. 市区町村ID 件数の歴史的推移 - 各時点における市区町村IDの一覧と件数の歴史的推移

市区町村の一覧地図

  1. コロプレス地図 一覧 - 市区町村を色塗りするためのコロプレス地図(塗り分け地図)
  2. ベクトルタイル地図 - 各時点における全国の市区町村境界を詳細かつ軽量に閲覧できる地図
  3. 行政境界データセット ベクトルタイル地図 - 全国の市区町村から町丁・字までを連続的にズームイン/アウトできる地図
  1. 歴史的地名/現代地名による統合検索 - 歴史的地名/現代地名を対象とした統合検索
  2. データセット - 市区町村IDをまとめたデータセット

概要

歴史的行政区域データセットβ版とは、歴史的に存在した市区町村に識別子を付与し、そこに市区町村境界の歴史的変遷を紐づけたデータセットです。1889年の市制・町村制以降の市区町村を対象とし、市区町村境界の変遷を現在のウェブ地図(地理院タイル)上に可視化する「アニメーション表示可能な歴史地図」も提供します。過去の複数の年代にわたる市区町村境界のデータベースとして、調査や教育などにご活用ください。2023年10月現在、行政区域件数=16,856件、行政区域境界データ件数=577,857件(うち統合境界データ件数=31,432件)を提供しています。

さらに、行政区域をポリゴンとして提供するだけでなく、ポリゴンを代表する点も合わせて提供します。そのために、複数のオープンデータを統合して行政区域の代表点を推定するアルゴリズムも開発しました。また、国勢調査町丁・字等別境界データセットと連携することで、現在の市区町村については、より粒度の細かい町丁・字等を単位とした境界データも確認できるようにしました。

ただし、過去の行政区域については記録が不確かである部分も多く、正式な記録に基づくデータセットを構築するのは大変難しい課題です。そこで当面は「β版」として公開し、昔の地図を確認する際の補助データとしてご活用いただきつつ、今後のデータの充実に向けた要望の調査やコラボレーションの可能性などを探りたいと考えています。

なお、プロジェクトの全体像については、れきちめ:日本歴史地名統合データベースをご覧ください。

データセットの作成

利用したデータ

ポリゴンデータ

国土数値情報「⾏政区域データ」 (N03) 1920年〜2023年。 ただし公開データに対して、ごく一部の属性値に修正を適用している。
筑波大学「行政界変遷データベース」 1889年〜1968年。 筑波大学大学院 生命環境科学研究科空間情報科学分野 村山祐司研究室が公開。 1889年から2006年まで公開されているデータセットのうち、1968年以前のデータセットを利用する。 またオリジナルのデータセットに対して、日本測地系から世界測地系への変換、一部のポリゴンの結合、市区町村名などの属性値の修正を適用している。
『日本歴史地名大系』行政地名変遷データセット 1889年以前。 1889年以前の市町村との連続性を確認するために利用する。

ポリゴンデータの注意事項

まず国土数値情報「⾏政区域データ」については、各時点で参照したデータソースの違いにより、境界データが異なります。

1920年 「旧版地図」から作成
1950年〜1985年 「平成7年国勢調査統計地理情報 町丁・字等別境界」をベースに作成
1995年〜2000年 「2万5千分1地形図」から作成
2005年〜2006年 「数値地図(空間データ基盤)」から作成
2007年 「数値地図(行政界・海岸線)」から作成
2009年〜2012年 「数値地図25000(地図画像)」から作成
2013年 「数値地図(国土基本情報)」の行政区画データから作成
2014年 「数値地図25000(空間データ基盤)」から作成
2015年以降 「数値地図(国土基本情報)」の行政区画データから作成

特に1985年以前のデータは、1995年以降と比較するとデータソースが大きく異なるため、市区町村の重なりや隣接関係について実態とは異なる結果が生じやすくなります。こうしたデータソースの変化による一時的な重なりや隣接関係は、ノイズとして無視してよい場合も多いと言えます。しかし、市区町村の境界が実際に細かく変化することもあるため、完全に無視してよいわけではありません。そのため、「重なりが小さい市区町村を隱す」オプションにより、そうした市区町村の情報に関する表示をオン/オフできるようにしました。

ちなみに、国土数値情報の最初の年である1920年は、第1回の国勢調査が行われた年であり、この時から近代統計調査がスタートしました。

次に、筑波大学「行政界変遷データベース」は、1995年時点の町丁字界を単位地域として,1889年(明治22)から2006年(平成18)現在まで,その所属自治体の変遷を年次毎に採録したデータベースです。そのため、国土数値情報の1950年〜1985年の作成方法と類似していますが、細かな違いがあり一致しません。そのため「国土数値情報」と「行政界変遷データベース」を分けて扱うことにします。

このデータセットは1889年から始まっていますが、現在のところ国土数値情報との統合が完了したのは1920年以降です。また、1968年以降は、全国地方公共団体コードにより地方自治体の識別子が公式に管理されていることから、1968年以前のデータのみを利用します。

ちなみに、行政界変遷データベースの最初の年である1889年は、市制・町村制が施行された年であり、この時から現代に続く地方自治制度がスタートしました。1889年以前については、本データセットと連続する『日本歴史地名大系』行政地名変遷データセットをご利用ください。ただしこのデータセットでは、ポリゴンデータは提供していません。

なお、すべてのデータセットに共通する問題として、小さな飛地などのポリゴンが省略されていたり、詳細に見ると正確な境界になっていなかったりする問題があります。より正確なデータが必要な場合は、しかるべき資料を参照して下さい。また現在については国勢調査町丁・字等別境界データセットの方が、境界を詳細に確認することができます。

ポイントデータ

国土数値情報「市区町村役場データ」 (P34) 2014年
国土数値情報「市町村役場等及び公的集会施設データ」 (P05) 2010年
国土数値情報「郵便局データ」 (P30) 2013年
国土数値情報「警察署データ」 (P18) 2012年
国土数値情報「消防署データ」 (P17) 2012年
国土数値情報「国・都道府県の機関データ」 (P28) 2014年

これらのポイントデータは、代表点の付与に用いています。

変遷データ

政府統計の総合窓口(e-Stat)「廃置分合等情報」 CSV形式「廃置分合等情報」1970年4月1⽇以降
政府統計の総合窓口(e-Stat)「標準地域コード」 CSV形式「標準地域コード」
政府統計の総合窓口(e-Stat)「統計LOD」 CSV形式データ

これらの変遷データは、市区町村ID(Geoshape City ID)の付与に用いています。

市区町村ID(Geoshape City ID)の付与

1968年以降は市区町村のための標準化されたコードが存在しますが、問題は1968年12月1日以前までに消滅して市区町村コードが付与されていない場合です。こうした市区町村に対しても、名称の連続性や廃置分合等情報、その他の特殊な場合などを調べ、データセットに出現するすべての市区町村にユニークなID(Geoshape City ID)を付与しました。これにより、現在は存在しない市区町村でも一意に特定することが可能です。

なお情報源となるポリゴンデータには、市区町村に含まれない領域(所属未定地など)も含まれており、これらのIDには「999」という文字列が含まれています。このような市区町村IDについては、市区町村ID件数の歴史的推移データセットからは除外しています。

代表点の付与

行政区域のポリゴンは、国土数値情報ダウンロードサービスからダウンロードしたデータを、ウェブと親和性が高いGeoJSONやTopoJSONフォーマットに変換することで、それぞれの年代ごとに用意することができます。しかしGeoNLPやその他のサービスでは、ポリゴンではなくポイントとして地理情報を扱いたい場合があるため、ポリゴンを代表するポイントを定めることが必要になります。

現在も存在する市区町村ならば、国土数値情報「市区町村役場データ」を用いて、市区町村役場の場所を代表点と定めることができます。ただし2014年時点で存在しない市区町村では、この方法は使えません。

そこでかつて存在していた市区町村の代表点を定めるために、別のオープンデータである国土数値情報「市町村役場等及び公的集会施設データ」を利用します。このとき注目したのはかつての市区町村役場の痕跡です。市町村合併によって市区町村役場でなくなった公的施設は、その後すぐに消えるわけではなく、今でも「支所」や「出張所」などの名称で使われていることが多いからです。また、かつての市区町村役場でないとしても、公的施設は中心的な集落に位置することが多いため、代表点として妥当な場合が多いと考えています。

それでも代表点が定まらない場合は、国土数値情報「郵便局データ」を活用します。郵便局もかつては国が運営する事業であり、立地の選定は公的なプロセスで進んだと考えられるため、代表点の候補としてふさわしいと考えました。

以上のデータに当てはまるものが一つもない場合は、ポリゴンの重心を代表点とすることにしました。ただしポリゴンの重心がポリゴンの内部に入らないような場合は、それがポリゴンの内部に入るような補正を行いました。重心は人口の分布などを考慮しない計算方法のため、行政区域を代表する点として適切でない場合があります。これをどのように改良するかは今後の課題です。

なお代表点の選定プロセスは、現在から過去にさかのぼって進めていきます。まず、現在まで存続している市区町村の代表点を、最も新しい境界データに基づき選定します。次に、過去に消滅した市区町村については、最後の時点でどこの市区町村にも選ばれていないポイントを代表点に選びます。この方式で1920年までさかのぼり、すべての市区町村の代表点を選定します。2023年3月時点のデータでは、代表点の種類ごとの件数は以下のようになりました。

市区町村役場データ(P34) 8,928
市町村役場等及び公的集会施設データ(P05) 6,896
郵便局データ(P30) 635
警察署データ(P18) 59
消防署データ(P17) 7
国・都道府県の機関データ(P28) 1
上記以外のデータを参照 1
重心 289

行政区域の地図表示

歴史的行政区域データβ版の表示には、国土地理院の地理院タイル(標準地図)を利用しています。

行政区域は時期ごとに表示/非表示を選ぶことができます。ヘッダ行のチェックボックスを使えば全データをオン/オフできます。このあと全データをオンすると、最初から最後までの行政区域の変化をアニメーション表示します。また個別データをオンにしていくと、行政区域がどのように変化してきたかを比較することができます。

歴史的に拡大を続けてきた市区町村の例を以下にいくつか紹介します。

近隣行政区域

関連する行政区域として、距離が近い行政区域をリストアップします。距離の計算は本サイトで選定した代表点を基準とし、距離が小さい方から上位約30件を表示しています。

標準地域コード

標準地域コード 一覧

本サイトは歴史的な行政区域のアーカイブを目的としてはいますが、一方で最新の行政区域を入手したいという場合も多いと考えられます。そこで、標準地域コードごとに、最新のポリゴンデータに入手するインタフェースも用意しました。こちらのIDから歴史的行政区域データにアクセスすることも可能です。なお、市区町村コードとしてよく使われる「全国地方公共団体コード」は、「標準地域コード」と最初の5桁が共通しています。また行政区域を一意に識別するための「行政コード」は、JIS X 0401に定められた都道府県コード(2桁)と、JIS X 0402に定められた市区町村コード(3桁)を結合した5桁の値からなり、「標準地域コード」と一致します。

フォーマット

本サイトで公開する市区町村境界データは、すべてGeoJSONまたはTopoJSONフォーマットを利用しています。一方、地理情報システム(GIS)で広く使われているシェープファイル(shp)フォーマットは利用していません。その理由は、シェープファイルフォーマットがバイナリ形式であるのに対して、GeoJSONやTopoJSONフォーマットはテキスト形式であり、しかもJSON形式であるため、ウェブアプリなどから呼び出して使いやすいことにあります。

基準年月日

国土数値情報については、データが定義する基準年月日を参照していますが、同じ年度のデータであっても基準年月日が異なる場合があります。

一方、行政界変遷データベースについては、基準年は明確ですが月日が明確ではないため、月日にはともに00を入力しています。

データ修正

本サイト構築の過程で、国土数値情報「行政区域データ」に不整合や表記揺れなどの問題が多数見付かったため、その結果は「国土情報提供サイト運営事務局」にフィードバックしています。

コロプレス地図

コロプレス地図 一覧

市区町村ごとに独立した境界データを統合し、市区町村を色塗りするためのコロプレス地図(塗り分け地図)データセットを提供します。境界線を統合した上で解像度を落とすため、境界線に隙間ができないことが大きな特徴です。それぞれのポリゴンにはGeoshape IDを付与しているため、データとバインドすることで塗り分け地図が作成できます。

解像度は5種類あります。フル解像度は国土数値情報で提供する解像度のデータですが、これで全国を描画しようとすると、ブラウザのメモリを使い切って固まってしまいます。そこで解像度を落としたデータとして、高い順から「高解像度」「中解像度」「低解像度」「粗解像度」の4種類を用意しました。一つ解像度を落とすことで、データ量はおおむね80%小さくなります(1/5になります)。おすすめは「低解像度」ですが、速度重視の場合は「粗解像度」でも実用的には十分かもしれません。データ形式としては、TopoJSON形式のみを提供します。

ベクトルタイル地図

塗り分け地図をさらに軽量化する技術がベクトルタイル地図です。タイル分割を用いると、表示に必要なデータのみを送信し、解像度に応じて詳細度を自動的に調整できるようになります。そのため、TopoJSON形式では不可能な、全国の市区町村境界のフル解像度表示も可能となります。

なお1889年から1919年については、都道府県ごとに順次作業を進めているため、一部の都道府県しかデータがないことにご注意ください。

データセット

データセット

本サイトで提供するデータの一部を、ダウンロード可能な形式で提供します。

ライセンス

このウェブサイトのコンテンツは、CC BY 4.0の下に提供されています。

ただし、本サイトで利用している国土数値情報「行政区域データ」の利用規約については、国土数値情報ダウンロードサービスをご参照下さい。

データセットをご利用の際には、以下のようなクレジットを表示して下さい。

『歴史的行政区域データセットβ版』(CODH作成)

GeoNLP
自然言語文から地名を抽出してマッピングするためのデータ、ソフトウェア、アプリ環境。GeoNLPからGeoshapeのGeoJSONデータを指定すると、市区町村内に限定した解析が可能となる。
GeoNames.jp
日本地名のURI基盤。市区町村に加えて街区レベルでユニークなURIを提供しているが、URIには時間が含まれないため、現在と過去で区域が変化した市区町村などを一意に指定することはできない。また区域データは提供していない。
Linked Open Addresses Japan
日本の住所データを変換してLinked Dataとして提供しており、市区町村や町・丁目については行政区域データも提供している。ただしURIに時間が含まれていないため、過去のデータにさかのぼることはできない。
GADM
世界の国ごとに、地域の境界データを提供。地図表示、データダウンロード可能。
OpenAddresses
世界の国の住所データを提供。地図表示、データダウンロード可能。

歴史的行政区域データセットと他のデータセットとの大きな違いは、時間方向で行政区域を区別するために独自IDを付与したこと、そして各IDに対するポリゴンの履歴を取得できる点にあります。また、行政区域の代表点の定め方に独自の方法を導入している点も特徴です。このIDはもちろんLinked Dataの基盤となりうるものですが、本サイトはLinked Dataとしてのサービスは提供していません。本サイトは「リポジトリ」という名称が示すように、オープンなデータの可視化と共有を主な目的としています。

論文/発表

  1. 北本 朝展, "地名情報基盤GeoLODによる地名識別子の収集・共有・活用と歴史ビッグデータ研究", 人文科学とコンピュータシンポジウム じんもんこん2022論文集, pp. 7-14, 2022年12月
  2. 北本 朝展, 村田 健史, "歴史的行政区域データセットβ版をはじめとする地名情報基盤の構築と歴史ビッグデータへの活用", 情報処理学会技術報告, Vol. 2020-CH-124, No. 1, pp. 1-8, 2020年9月
  3. 北本 朝展, 村田 健史, "歴史的行政区域データセットβ版をはじめとする幾何データ共有サイト「Geoshape」の構築", 日本地球惑星科学連合(JpGU)2020年大会, No. MGI41-15, 2020年7月 (招待講演)

ニュース

2023-10-18
歴史的行政区域データセットβ版を、以下の点について更新しました。
  1. 『日本歴史地名大系』行政地名変遷データセットで先行公開した栃木県と群馬県に関して、1889年と1919年の間に27件の市区町村を追加しました。また、1889年まで延長した都道府県に限定して、コロプレス地図も公開しました。
以上の更新により、行政区域件数=16,856件、行政区域境界データ件数=577,857件(うち統合境界データ件数=31,432件)となりました。
2023-07-05
歴史的行政区域データセットβ版を、以下の点について更新しました。
  1. 「行政界変遷データベース」由来の一部のデータについて、ファイル名の月日が「0000」となっていましたが、これを正しい月日の「1231」に修正しました。
  2. 正式な市区町村ではないポリゴン(所属未定地など)由来の名称の表記揺れを統一しました。ただし、一部にまだ統一てきていない名称が残っています。
  3. 2023年版のデータを追加しました。
以上の更新により、行政区域件数=16,829件、行政区域境界データ件数=565,338件(うち統合境界データ件数=30,688件)となりました。
2023-05-08
歴史的行政区域データセットβ版の一部のページにおいて、年月日の並び順が正しく表示されるように修正しました。
2023-03-30
歴史的行政区域データセットβ版を、以下の点について更新しました。
  1. 筑波大学が公開する「行政界変遷データベース」(1920年〜1968年)を統合しました。
  2. 行政区域が大きく変化した年のデータのみを地図表示することで、地図表示をシンプルにしました。
  3. 一部の市区町村IDの重複を解消しました。
  4. 2022年版のデータを追加しました。
以上の更新により、行政区域件数=16,816件、行政区域境界データ件数=561,090件(うち統合境界データ件数=30,620件)と、データの規模は大幅に拡大しました。
歴史的行政区域データセットβ版を、以下の点について更新しました。
  1. 2021年版のデータを追加し、行政区域件数=16,447件、行政区域境界データ件数=102,578件(うち統合境界データ件数=11,220件)となりました。
  2. 代表点を選ぶアルゴリズムを改良しました。新たに警察署データおよび消防署データを代表点候補に追加しました。
  3. 現在と過去の市区町村の重なりの計算方法を整理し、重なりの割合を表示するようにしました。
2020-09-19
歴史的行政区域データセットβ版の市区町村名を精査し、表記ミスを修正して統合した結果、行政区域件数=16,447件に減少しました。なお、今回の処理で利用しなくなった市区町村IDは欠番としているため、その他のIDは変更ありません。また行政区域境界データ件数=99,296件(うち統合境界データ件数=10,832件)も変化ありません。
2020-08-24
歴史的行政区域データセットβ版のデータ処理の誤りを修正し、行政区域件数=16,460件、行政区域境界データ件数=99,296件(うち統合境界データ件数=10,832件)となりました。新たに追加したのが、東京府東京市および東京都特別区部です。
2020-08-07
歴史的行政区域データセットβ版 ベクトルタイル地図を公開しました。バイナリベクトルタイルを用いることで、行政区域境界の変遷をより詳細にかつ軽量に確認することができます。
2020-07-31
歴史的行政区域データセットβ版のデータ処理の誤りを修正し、行政区域境界データ件数=99,268件(うち統合境界データ件数=10,832件)となりました。
2020-07-28
歴史的行政区域データセットβ版を、以下の点について更新しました。
  1. 2020年版のデータを追加し、行政区域件数=16,458件、行政区域境界データ件数=99,243件(うち統合境界データ件数=10,832件)となりました。
  2. 市区町村IDを4件変更しました(01472A1968→01472A2010, 01520A1968→01520A2010, 07505A1968→07505A1994, 09410A1968→09410A1982)。
  3. 代表点を選ぶアルゴリズムを改良しました。郵便局データを新たに代表点候補に追加するとともに、現在から過去への連続性を優先させた代表点決定方法に変更することで、重複のない代表点が選定できるようになりました。
  4. 現在と過去の市区町村の重なりに対して、しきい値以下の重なりは表示しないようにしました。
  5. 市区町村ID 件数の歴史的推移を公開しました。
2020-06-04
歴史的行政区域データセットβ版において、市区町村の歴史的変遷の表示方法を変更し、歴史的変遷の前後関係がより詳細につかめるよう可視化しました。
2019-08-08
歴史的行政区域データセットβ版において、今回の更新で追加した政令指定都市に関するデータの問題を修正し、行政区域件数=16,459件、行政区域境界データ件数=86,107件、統合境界データ件数=10,822件となりました。
2019-07-28
歴史的行政区域データセットβ版に2019年版データを追加し、行政区域件数=16,438件、行政区域境界データ件数=86,107件となりました。またTopoJSONファイル(コロプレス地図含む)のメタデータ構造を変更しました。また過去の行政区域と現在の行政区域の対応づけ、および1970年以前の行政区域の変遷についてもデータを追加しました。
2019-01-17
歴史的行政区域データセットβ版に、「市区町村の歴史的変遷」(1970年4月以降)、「隣接行政区域」、「リンクトオープンデータ」の項目を追加しました。また歴史的地名/現代地名による境界データ検索をリリースしました。
2018-11-21
歴史的行政区域データセットβ版に2018年版データを追加し、行政区域GeoJSON件数が82,318件から84,199件に増えました。またコロプレス地図の公開やデータセットの公開など、機能が充実しました。なおTopoJSONの拡充に伴って、GeoJSONのURLを変更しましたので、ご注意下さい。
2018-07-29
歴史的行政区域データセットβ版にTopoJSONデータを追加するとともに、一部の不具合を修正することで、行政区域件数が16,429件から16,436件に、行政区域GeoJSON件数が82,311件から82,318件に増えました。
2018-06-02
歴史的行政区域データセットβ版で一部の行政区域が出力されていなかった問題を修正しました。
2017-07-01
歴史的行政区域データセットβ版の近隣行政区域を地図表示できるようにしました。
2017-06-23
歴史的行政区域データセットβ版に2017年版データを追加し、本日時点までの各種データ修正も適用した結果、行政区域件数が16,428件から16,429件に、行政区域GeoJSON件数が82,311件に増えました。
2017-05-20
歴史的行政区域データセットβ版のインタフェースを修正し、表示時期を選択しやすくしました。
2017-03-18
歴史的行政区域データセットβ版に2016年版データを追加するとともに、一部のデータの不具合に対して変更または削除を行いました。
2017-01-15
歴史的行政区域データセットβ版を公開しました。