地球科学におけるFAIRデータの重要性

ヤンス・アースマン博士15 10月 2019
著者について:Jans Aasmanは博士号です。心理学者、認知科学の専門家、人工知能の初期の革新者であり、主要なセマンティックグラフデータベースであるAllegroGraphのプロバイダーであるFranz Inc.のCEO。
著者について:Jans Aasmanは博士号です。心理学者、認知科学の専門家、人工知能の初期の革新者であり、主要なセマンティックグラフデータベースであるAllegroGraphのプロバイダーであるFranz Inc.のCEO。

エンタープライズ資産としてのデータの評価は、時間の経過とともに最も急激に実現されます。適切に管理されると、同じデータセットが複数のユースケースをサポートし、リクエストに応じてほぼ瞬時に利用可能になり、部門または組織間で交換できるため、展開ごとに歩留まりが体系的に向上します。

企業資産としてデータを活用するこれらの恩恵は、地質科学のデータ管理の厳しさに大きな影響を与えるGO FAIRのFindable Accessible Interoperable Reusable(FAIR)原則の基盤です。この分野の多くの組織は、これらの教義を受け入れて、地球のスチュワードシップを安全に導くために、多様な分野間で情報を迅速に共有しています。

地球科学情報パートナー(ESIP)のラボディレクター、アニーバージェス博士によると、「最も差し迫ったグローバルな課題は、単一の組織で解決することはできません。地球科学コミュニティの多数のメンバーが認識しているように、FAIRの原則に従ってこれらの異種データを管理する最も効果的な手段は、セマンティック標準を利用することです。基礎知識グラフ。

メタデータ、データモデル、および用語を管理するこれらの統一されたアプローチは、FAIRデータ移動の要であり、科学コミュニティの貴重な資産としてのデータの場所を保証します。

共同科学
ナレッジグラフをサポートするセマンティック標準は、機械で読み取り可能な形式でデータを一意に識別し、即座にアクセスし、共有するために設計されています。これらは、World Wide Webでこれらの利点を促進するのと同じ基準であり、地質科学分野でデータを再利用するのに非常に有益です。この分野は、海洋生物、大気の問題、陸地、地下の開発を含む非常に広範であるため、より挑戦的な科学分野の1つです。これらの異なる専門分野でデータを迅速に共有する機能は、データを一意に識別し、機械可読技術を介して迅速にアクセスする他の利点と同様に、フィールド全体を前進させるための不可欠な側面です。

カリフォルニア工科大学のジェット推進研究所のデータ科学者であり、NASA ESDSWG Search Relevance Working Groupの共同議長であるDr. Lewis McGibbneyが観察しました。同様の目標と、知識集約型のアプリケーションが必要であるという認識を持つ世界。さらに、セマンティック標準により、これらの組織はデータと結果を再利用可能な形式で公開できるため、さまざまな組織がお互いの労働から直接利益を得ることができます。

人間と機械のリンク
FAIRアプローチは、ナレッジグラフ内のさまざまなデータのリンクを中心に展開します。これらのナレッジグラフは、さまざまな組織間でリンクしたり、ユニバーサルアクセスのためにWeb上で「公開」したりできます。これは相互運用性にとって重要です。このアプローチでは、個々のデータに固有の識別子が必要であるだけでなく、標準化された語彙とタクソノミに基づいたメタデータの豊富な説明も必要です。セマンティックデータモデル(オントロジー)は、アプリケーションごとに異なる組織で使用されるスキーマの固有の違いを標準化し、FAIRの原則を採用するITシステムの相互運用性をさらに支援します。

Monterey Bay Aquarium Research InstituteのシニアソフトウェアエンジニアCarlos Ruedaは次のようにコメントしています。 Marine Metadata Interoperability Projectのさまざまな科学組織が、この標準化された方法で無数のリポジトリのオントロジーを登録できるようにすることで、データ統合とアクセシビリティが促進されます。

統一された多様性
おそらく、地球科学コミュニティ内で知識グラフを使用してFAIR原則を実行することの大きな利点は、科学者に関連するさまざまなダイバーデータを標準化できることです。この分野の膨大な数の異なる専門分野には、一見無限の種類のデータが必要です。ソースには、衛星データおよび物理サンプルからのデータに加えて、水、空中、および地上のソースからのセンサーデータが含まれます。さらに、これらのデータは多くの異なる空間的および時間的解像度によって特徴付けられ、それらを均一に管理する全体的な複雑さを増しています。この点で、セマンティックデータモデルは、データを記述するための統一語彙にかなり役立ちます。バージェス博士は、「ESIP Community Ontology Repository、科学者がデータを公開、発見、再利用するのを支援する用語と語彙を管理および交換するコミュニティプラットフォーム」のメリットをほのめかしました。

長期的な伝播
地質科学コミュニティ内の豊富なユースケースが示すように、データの真の自尊心は、永続的な再利用性と即時のアクセシビリティに基づいています。これらの優先事項により、実装のセマンティックテクノロジーに依存するFAIRの動きが生まれました。このアプローチは、現代の組織に適用した場合と同じ利点、つまり企業資産としてのデータの価値の向上をもたらします。

著者について
Jans Aasmanは博士号です。心理学者、認知科学の専門家、人工知能の初期の革新者であり、主要なセマンティックグラフデータベースであるAllegroGraphのプロバイダーであるFranz Inc.のCEO。科学者兼CEOであるアースマン博士は、フォーチュン500の多くの組織や米国および外国政府と協力して、人工知能と知識グラフの分野で着手し続けています。アースマン博士は、応用人工知能プロジェクト、インテリジェントユーザーインターフェイス、および通信研究に特化した専門家としてのキャリアの大部分を費やしてきました。彼は音声技術、マルチモーダルユーザーインタラクション、レコメンデーションエンジンの分野で特許を収集し、タブレットやパーソナルアシスタントの前駆体技術を開発しました。彼はデルフト工科大学の工業デザイン部門の教授であり、Smart Data、NoSQL Now、International Semantic Web Conference、GeoWeb、AAAI、Enterprise Data World、Global Graph Summit、Text Analytics、 TTI Vanguard。