ANNAIマガジン
Drupalcon Portland 2022 ロゴ
この記事の目次

ANNAI は Drupalcon Portland 2022 にて、我々の手掛けた政府統一 Web サイトプロジェクトと、その検証事業の一環としてのデジタル庁ウェブサイトのヘッドレス CMS(Drupal + Next.js)への移行について講演を行いました。

講演は 3 部で構成されています:

  1. デジタル庁ウェブサイトのヘッドレス CMS への移行
  2. 政府統一 Web サイトの実現のための調査事業
  3. 今後の方向性について

このブログポストでは、上の第 3 部について記しています。

府省サイトの統一が求められた経緯は、利用者に対する利便性の向上や、開発や運用の効率の向上が挙げられます。詳細についてはこのシリーズの最初のポストで詳しく説明していますのでそちらをご覧ください。

* このブログポストの内容は 2022/04 の講演の内容であり、以下のビジョンには 2021/12 当時のものも含まれています。最新のものとは異なる部分もありますので予めご了承ください。

第 2 部のポストで挙げたの問題と制約を踏まえて、ANNAI は次のような政府統一 Web サイトの像を提案します:

全府省庁サイトを単一ドメインに統合

全府省庁のコンテンツを単一ドメインに集約することでドメインオーソリティーの向上を図ると共に、各府省庁が掲載するコンテンツの横断検索を可能にします。

全府省庁共通コンテンツの掲載

  • 政策、政府刊行物、白書や広報など、全府省庁に共通するコンテンツを掲載します
  • 情報の見つけやすさの向上および、情報検索の行き止まりを排除します。具体的には:
    • ページを閲覧する際に、そのページのメタデータ(コンテンツタイプやタグなど)に基づき、検索ファセットが選択された状態で表示される。これにより関連情報を見つけることがより容易になる
    • PDF などのアタッチメントは原則クロール不可にし、アタッチメントの内容をページ内に埋め込むことで検索結果から PDF にたどり着いてしまう問題を解消する
  • 先述の制約を考慮し、府省庁合同によるコンテンツの制作は、統一 Web 立ち上げ当初には行いません

アーキテクチャー

各省庁の政府統一 Web への移行は一斉に行われるのではなく、段階的に行われることを想定しています。そのため、初期は単一の Drupal インスタンスを用い、また Group / Subgroup モジュールを導入することにより、各組織のユーザーの権限の複雑な階層構造をシステム上で再現することを検討しています。

最終的にはコンテンツ入力・管理専用の Drupal インスタンスを各組織ごとに提供し、コンテンツは中央のシステムに一元的にストアし、それを配信のオリジンとすることを検討しています。

なお、各省庁がそれぞれ独立したバックエンドシステムからコンテンツを入力し、一元的にコンテンツ管理を行う方法は gov.uk のアーキテクチャーを参考にしています。

今後の予定および構想

2022 年度の予定

既存システムおよびユーザーニーズについての更なる調査

2021 年度までに様々な調査を行ってきましたが、そのなかで新たに浮上した課題や、未知の部分についての調査を進めます。これにはエンドユーザー側のニーズだけでなく、各府省庁で利用しているシステムやツールとその利用状況についての調査も含まれます。

ハイレベルのシステム要件定義

ハイレベルのアーキテクチャーおよびシステムの要件定義を行います。

ロードマップの策定

統一ウェブは壮大なプロジェクトであり、短期間に調査・仕様設計・開発・移行・運用を行えるものではないため、長期的なロードマップの策定が必要となります。

将来的な構想

サイトコンテンツを含むLOD (Linked Open Data) への対応

ネット上に散在するデータの関連性を定義することで検索の精度を向上させる技術(Linked Open Data = LOD)は、現状の政府サイトでは活用されていません。政府が提供するデータの機械判読性を高め、国民が必要とする情報をより簡単に発見・入手できるよう、RDF (Resource Description Framework) によるデータ定義が必要と考えます。(現在 data.go.jp で入手可能な行政文書の多くは、ファイル名や属性などがユーザーにとって意味のあるかたちで付与されていないため、サイト内で検索や絞り込みを行っても探している情報を発見することが難しいのが実情です。)

政府の情報の属性や関連性を定義し LOD として提供する試みは、DCAT (Data Catalogue Vocabulary)、CPSV (Core Public Service Vocabulary)、LOGD (Linked Open Government Data) などを通して欧米を始めとする各国政府によって既に行われています。政府統一 Web でもサイト上のデータを LOD として提供することで機械判読性を高め、検索の精度や利便性を高めていきたいと考えています。

公文書の「レスポンシブ化」

現状、多くの公文書は PDF ファイルとして保管・配信されています。しかし、モバイルデバイスなどの小さい画面では読みにくかったり、コンテンツの再利用がしにくいなどの問題があります。

この解決法として、デジタル庁ウェブサイトのコンテンツ入力にも利用されているマークダウンを、行政文書の記述に利用することを提案します。行政文書を PDF などの特定の形式に基づいたファイルではなくテキストデータとして保存し、API を経由してのデータの取得や、PDF をはじめとする様々なファイル形式で提供可能にすることで、行政文書のアクセシビリティーと再利用性を大幅に改善することが可能になります。

テキストデータとして情報を保管するにあたり容易にデータを改ざんできてしまうことが懸念されますが、ブロックチェーンなどを活用して情報の整合性を保証することが可能と考えます。

申請手続きへの対応

現状、各省庁のサイトはユーザーが手続きをはじめとする情報を得るために訪れる場所ですが、実際の手続きを行うことはできません。利便性向上のために、各種登録/申請などの手続きも統一 Web 上で行うことができるようにすることを目指したいと考えています。

まとめ

デジタル庁ウェブサイトのヘッドレス CMS への移行、日本の府省庁が運営するウェブサイトの利用および運営保守に関する調査、そして他国政府のウェブサイト統一方法の調査を通して、日本国民および政府にとって適切な統一ウェブのかたちが見えてきました。今後のさらなる調査によって、より具体的な仕様と、それを具現化するための長期的な計画を提示していきたいと思います。

 

 
フッターの採用情報
 
Mori Sugimotoの写真

この記事を書いた人: Mori Sugimoto

2006 年から欧米の大規模 Drupal 案件で開発・アーキテクチャーやコンサルティングなどを担当。コア・拡張モジュールの翻訳、また国内外でのミートアップのオーガナイズや Drupalcon での登壇およびボランティアなど積極的にコミュニティに参加。2008 年より Drupal Security Team コーディネーターを務める。オランダ在住。

関連コンテンツ