トップページ > メタデータ情報基盤について(協議会の成り立ち)

協議会の成り立ち

メタデータ情報基盤について

メタデータ情報基盤に関する入門的な説明です。わかりやすく書いているつもりではありますが、どうしても専門的な用語を用いがちであることは否めません。より詳しい説明には参考文献をご参照ください。

 

1. メタデータ(Metadata)とは

メタデータは、一般に「データに関するデータ」と定義されます。これは、「何かについて書いたもの」という意味でとらえるとわかりやすいです。たとえば、本の目録や奥付、紹介はすべて本のメタデータです。レストランのメニューやペットボトルにつけられたラベルもメタデータです。レストランではメニューなしに注文はできませんし、メニューには料理の名前だけでなく中身やカロリー、料理の写真などいろいろな内容が含まれています。飲料の自動販売機から、ラベルのない裸のペットボトルが出てきたらあなたは中身を飲むことができるでしょうか?

 

このように物理的な世界の中でもメタデータは大きな役割を持っています。ネットワーク上に広がる世界ではどうでしょう?メタデータなしにどのようなことができるでしょうか?裸のボトルの飲料を飲むことは、中身が全く分からないファイルを開けたり、Webページにアクセスするのと同じことです。ネット上では、自分が使うものに関する情報、すなわちメタデータを頼りにしていろいろなことを行っているのです。

 

ネットワーク上で用いるメタデータにはいろいろなものがあります。商品のカタログ、本の目録、コンピュータのソフトウェアの利用環境要件、テレビの視聴年齢要件などは典型的なメタデータです。同じ内容のコンテンツでも、利用者の特性や利用環境の要件によって適切なものを選ばねばならないことがあります。たとえば、視覚に障害を持つ利用者の場合、コンピュータによる読み上げが可能かどうかは大事な要件ですから、もし同じ内容の電子本があり、一方は自動読み上げ可能、他方は不可能ということになれば、自動読み上げ可能なものを選ぶ必要があるでしょう。こうした場合、コンテンツのメタデータと利用者や利用環境のメタデータを組み合わせて使うこともあります。

 

2. ネットワーク上でのメタデータ

ネットワーク上において私たちは、必要なものを探し、選び、アクセスし、視聴・利用し、必要に応じて支払いもします。これらのすべての過程でメタデータが利用されています。このことは、ネットワーク上ではいろいろなメタデータを組み合わせて使う必要があることを意味しています。すなわち、提供されるいろいろな異なるメタデータを組み合わせて使うためのメタデータの相互運用性を高めることが必要です。また、作成後時間のたったメタデータを適切に保存し、他のメタデータとの相互連携ができるようにしておくことも大事です。

 

このように、ネットワーク上では様々なメタデータが使われます。メタデータは個別のデータベースに格納される一方、ネットワーク上でやり取りもなされます。現在のWWWにおけるデータ(テキスト)のやりとりは、XML形式が用いられています。したがって、ネットワーク上でのメタデータのやり取りも、ネットワークの環境に合うように標準化された形式を用いる必要があります。WWWコンソーシアムが決めたメタデータの標準規格としてResource Description Framework (RDF)があります。本プロジェクトではRDFをベースとなる標準として用いています。

 

メタデータの相互運用性を高めるための重要な要件は、メタデータに関する規則を誰からも見えるようにし、メタデータの共有と再利用を促進することです。メタデータの規則を作るには、メタデータとしてどのような項目をどのようなデータ形式で記述するのかを決めることや、記述対象からどのようにして記述内容を取り出すのかといったことを決めなければなりません。たとえば、前者については、本のメタデータとして、「題名、著者、出版社、出版年を書くことにする、出版年は西暦で書く。そしてデータはXMLで表す」といったこと決めることになります。後者については、「主たるタイトルと副タイトルをどう取りだすか、文の作者と絵の作者がいる場合の著者はどのように扱うか」といったことを決めることになります。さらにメタデータの相互運用性を考えると、「題名」、[著者]と言ったことばの意味をきちんと決めておかねばなりません。意味をきちんと決めておくことで、異なる規則で作られるメタデータ間でのことばの意味の食い違いが減らせることに加えて、同義語、上位語、下位語といったことば同士の関係を定義して利用することができます。こうしたメタデータの規則、特に前者をメタデータスキーマと呼びます。

 

3. メタデータスキーマ (Metadata Schema)

メタデータスキーマはメタデータの記述項目や記述形式を決めます。メタデータの相互運用性を高めるには、メタデータスキーマの情報を共有できるようにすることが不可欠です。従来、メタデータスキーマは国際標準や業界標準といった形で作られてきました。これらは目的や分野のニーズに合わせて作られるもので、いわばコミュニティ内のメタデータの相互運用性に向けたものです。ところが、いろいろな利用者が同居するネットワーク上では、コミュニティの違いを越えてメタデータの相互運用性を高めることが求められることになります。

 

メタデータスキーマには、大きく分けて3つの面があります。

(1) メタデータとして記述する項目の定義 ― 項目の名前とその意味を定義します。換言すると、メタデータ記述の中で用いる語彙(Metadata Vocabulary)の定義です。

(2) 記述項目ごとの記述要件(メタデータの構造的制約) ― 必須、推奨、省略可能、繰返し可能回数などの構造的な制約、記述する内容(値)の形式やクラス(型)などの値の制約を定義します。

(3) メタデータの実現形式 ― XMLスキーマ、データベーススキーマ等、実際にメタデータをコンピュータ上、ネットワーク上で利用(記述、蓄積、検索、交換等)するための形式を定義します。

 

WWWコンソーシアムが決めるRDFにはRDF Model and SyntaxとRDF Schema (RDF Vocabulary Description Language)と呼ばれる規格が含まれています。RDF Model & Syntaxは、WWW上でのメタデータの交換や表現のベースとなるデータモデルとその具体的記述形式を決め、RDF Schemaはメタデータで用いる語彙定義の記述形式を決めています。本プロジェクトでは、RDFを基盤技術として用いており、メタデータ語彙の定義のためにRDF Schemaを用い、その他の要素の定義のためにDublin Core Metadata Initiative (DCMI)のApplication Profileの概念を用いています。

 

4. Dublin Coreとネットワーク指向のメタデータ

ネットワーク上では多様な目的で多様な対象に対するメタデータが作られます。こうしたメタデータの間の相互運用性を高めることは難しい課題ではありますが、重要な課題です。Dublin Coreは、インターネット上の情報資源の内容の記述に広く用いることができるメタデータの標準規格として有名なものです。特に、15項目からなるSimple Dublin CoreはISO規格(ISO 15836)にもなっており、非常に広く受け入れられています。Dublin Coreの開発を進めてきたDublin Core Metadata Initiative (DCMI)は、メタデータの相互運用性を高めるための概念的枠組みとして、Application Profileを提案し、その概念の明確化を進めてきました。Application Profileは、メタデータのスキーマを定義する上で、語彙と構造的制約を完全に分離し、いろいろなメタデータ語彙の中から適切な記述項目を選び出し、それらを組み合わせて特定の応用向けのメタデータ語彙を作り、さらにその上にその応用に適した構造的制約を定義することで、応用向けのメタデータスキーマを定義しようというものです。こうすることで、応用ごとにメタデータ語彙を定義する必要がなくなると同時に、異なる応用目的のメタデータスキーマの間で、部分的にではあっても、同じメタデータの記述項目を利用することが容易になります。すなわち、メタデータを記述する上での基盤である記述項目を、異なるメタデータスキーマが共有されることになり、おのずと異なるメタデータ間で共通部分ができ、相互運用性を高めるために寄与することになります。

 

DCMIでは、最初の記述項目集合の標準化(1998年)の後、Application Profileの概念の明確を進めました。そして2007年にはSingapore Frameworkという名前で、Application Profileの参照モデルを発表しました。前の節に書いたメタデータスキーマの要素のうち、メタデータ語彙が(1)であり、Singapore Frameworkは(2)と(3)を定義することになります。DCMIが現在定めている記述項目は、過去のものへの互換性を目的としたものも含め約70語です。これらは記述対象にかかわる一般的な記述項目です。たとえば、人や権利といったものに関するメタデータの記述項目はDublin Coreには含まれません。Application Profileの概念に基づき、他の標準規格(すなわち、人向けの標準、権利向けの標準)が定めるメタデータ語彙を使うことを推奨しています。

 

メタデータ語彙の共有は、いわば、異なる目的のメタデータを使うコミュニティが共通のことばを話すことを意味します。すなわち、メタデータを記述する上で基本となる記述項目の意味とそれを表現する語句を共有することです。一方、コミュニティごとに特化した要求にこたえるには、コミュニティ独自のメタデータ語彙を用いることも必要です。DCMIのApplication Profileは、メタデータ語彙と構造制約、実現形式を分離することで、既存の語彙の中から適切な語を選んで記述項目を決めることができるモデルを明確化しました。既存の語彙としてできるだけ標準的なメタデータ語彙を使いれば、異なるメタデータスキーマ間であっても、おのずと共通部分ができています。一方、独自の語彙を使うことも可能ですから、応用ごとの要求を犠牲にすることはありません。このようにしてメタデータの記述項目を定義し、さらにその上でネット上でのデータ交換が可能な形式でメタデータを提供すればメタデータの相互運用性は向上します。RDFはそうした目的で用いる標準として作られたものです。すなわち、Application Profile概念とRDFを組み合わせることで、メタデータの相互運用性が高められると考えられます。

 

5. ネットワーク上でのメタデータスキーマの共有とメタデータ情報基盤

ここまでで明らかになったことは、メタデータの相互運用性を高めるには、メタデータスキーマを共有することが大事であるということです。すなわち、メタデータの語彙を共有すること、応用ごとに作られたApplication Profileを共有することです。ここで、共有することと言うのは、たとえば、ネットワーク上で自由に語彙の定義やApplication Profileの定義を見ることができるようにすることです。もちろん、利用者は、人間だけではなくコンピュータも含めて考えなければなりません。メタデータ情報基盤は、メタデータを利用するシステムやサービスの開発者をターゲットとし、メタデータに関する情報を提供するものです。ここでメタデータに関する情報とは、メタデータスキーマ、すなわち、メタデータの語彙とApplication Profileを意味します。

 

本プロジェクトで開発したシステムMetaBridgeでは、メタデータ語彙の定義のためにRDF Schema、Application Profileの定義のためにRDFをベースとした記述形式を定義して用いています。これはWWW上での標準規格としての高い流通性を目指したためです。また、RDF利用者以外の利用者向けに、Topic Mapsによる提供も含めています。

 

<参考>

[1] 神崎正英,セマンティック HTML/XHTML,毎日コミュニケーションズ,416p,2009

[2] 杉本重雄,Dublin Coreの現在,ディジタル図書館,no.36,2009 http://www.dl.slis.tsukuba.ac.jp/DLjournal/No_36/4-sugimoto/4-sugimoto.pdf

META-BRIDGE

META-BRIDGE

Meta Bridgeは、メタデータスキーマを収集・蓄積するメタデータレジストリです。

メタデータスキーマを簡単に発見でき、メタデータを利用したサービスの構築を実現します。

Meta Bridgeのアカウント登録はこちら