アーバンデータチャレンジ データポータルサイト

アーバンデータチャレンジ(UDC)は、東京大学が中心となり国交省を始め産官学の関係機関が連携し、社会インフラに関わる情報の収集・配信・利活用等の流通環境の整備を目的として、一般社団法人社会基盤情報流通推進協議会(AIGID)が実施している、オープンデータの利活用の推進を啓蒙するための活動です。

アーバンデータ チャレンジポータルサイト」では全国の自治体が公開している公共データをワークショップやアプリコンテストで利用できるように収集・公開しています。

udc

DrupalベースのDKANを導入した経緯

元々はデータ公開のためのプラットフォームとして、CKANを利用して4000件程度のデータを公開していました。しかし、データが量が多くなるにつれ、大量のデータの中から目的とするデータのみを効率的に、短時間で検索できる機能が必要になってきました。CKANは標準ではコンテンツのタイトルなどのメタデータでの検索は可能でしたが、ファイルの中身を全文検索する機能には対応していませんでした。また、CMSとしての機能を持たないCKANでは外観の変更や、ちょっとしたお知らせの追加、ユーザー管理等の機能を実装するのには、かなりの手間がかかるという現状がありました。

CKANの抱えるこれら課題を解決すべく、ANNAIとしてDrupalベースのオープデータ公開プラットフォーム、DKANの導入を提案させていただきました。DKANとApache Solr を組み合わせる事により、ファイル内を含めた全文検索および、ユーザーの検索を補助する、オートコンプリート機能を実装しました。

機能紹介と技術的なポイント

DKANとApach Solrによるファイル内全文検索とオートコンプリート機能の実装

コンテンツのメタデータおよび、PDF, CSV, エクセルファイル等の中身も含めた全文検索機能をDKANとApach Solrを連携する事で実現しました。これにより、利用者はより効率的に目的とするデータを検索する事が可能となりました。また、ユーザーの検索を補助する、オートコンプリート機能も実装しました。

udc

 

KMLやPDF、ファイルサイズの大きなCSVファイルのプレビューに対応

CKANやDKANでは標準で対応していない、KMLやPDFのプレビューに対応しました。また、容量の大きなCSVファイルのプレビューにも対応できるようにカスタマイズを行いました。

KML形式のプレビュー

udc

CKANからDKANへのデータ移行

DKANのHarvesting機能を元に独自にカスタマイズをかけたマイグレーションツールを開発し、DKANへ約4000件のデータ移行を行いました。また、CKANはデータのカテゴリ分けとして、「グループ」という概念を導入しています。CKANの「グループ」をDKANに移行するにあたり、Drupalの強力なカテゴリ機能を利用し、自由度の高いIA(Information Architecture )を構築しました。

udc

Drupalならではの拡張性で課題を解決

アーバンデータチャレンジ ポータルサイトに登録されているデータ数は6000件を超え、今や国内最大級のデータポータルサイトに発展しました。現在でも、盛んに自治体の公開データを収集し登録を行っています。オープンデータ化は国家プロジェクトとして推進されている事もあり、公開されるデータ数も日々増え続けています。これに伴い、データ登録にかかる時間やコストという問題が発生しつつあります。今後、これを解決するために、大量のデータを一括で登録する機能を実装する予定です。

ANNAIはDKANを利用したオープンデータの公開支援ソリューションを提供しています。

ANNAIではDrupalのディストリビューションである「DKAN」を活用した、オープンデータの公開支援ソリューションを提供しています。国・地方自治体、インフラ系の企業様における公的データのオープンデータ公開を支援いたします。DKANの信頼性・柔軟な権限設定・サイト内全検索・柔軟なデザイン・機能拡張性の高さなどの特性を活かしながら、管理側・利用者側ともに使いやすいオープンデータの公開をサポートいたします。

DKANの機能や事例について、詳細に知りたい方はこちらをご覧ください。
http://landing.dkan.annai.co.jp/

サイトURL
http://udct-data.aigid.jp/

大カテゴリ