メタ情報とセマンティック・ウェブ
This page is the table of contents of "The Intruduction to Metadata and Semantic Web". Most parts are written in Japanese, but everybody is welcome.
ウェブは人間が読むための「文書のウェブ」から、様々なデータを自在に発見して利用できる「データのウェブ」へと向かいます。セマンティック・ウェブと呼ばれる分野では、このデータのウェブを実現するために、表現のモデルや交換・共有を可能にするオントロジー、そして推論や頼性検証といった各レベルでの技術開発が進められています。メタデータを適切に与えることで、文書情報をこの「データのウェブ」に組み込むことが可能になります。
- RDFグラフとリンクするデータ
- リソースとメタデータの表現
- 語彙とオントロジー
- メタデータの応用と提供
- そのほか
- ★最近の関連情報 (2024-04-02)
RDFグラフとリンクするデータ
- Linked Data(説明スライドから)
- 連携するデータ、リンクするデータ (2007)
- リンクするデータ、未来へのリンク (2011)
- 日本十進分類とリンクするデータ(2016)の4原則アニメーション
- RDFグラフの視覚化(各構文のRDFデータを円と矢印の図に変換)
- Linked Data Browser(大きめのRDFデータを入れ子テーブルで整理)
- ジャパンサーチ非公式サポート (ツールの使い方、エンドポイント留意点、ジャパンサーチ名鑑(正規化名索引)、MAL統合クエリ、Web Annotationとの組合せなど)
- Image annotator (Web Annotationによる画像注釈やIIIFマニフェストを利用した画像コレクション表示の試み)
Linked First Folio (ボドリアン図書館シェイクスピア・サイトのTEI/XMLデータとデジタル画像を結びつける試み)
リソースとメタデータの表現
- ごく簡単なRDFの説明 できるだけ分かりやすくコンパクトに説明したスライド資料 (2014)
語彙とオントロジー
メタデータの応用と提供
- メタデータによる知人ネットワークの表現:FOAF (例)
- 写真/画像とメタデータ (暫定公開)
- 位置に関するメタデータとその応用
- FOAFとRSSを用いた画像メタデータ
- イベント情報の公開と活用:RDFカレンダー
- サイト情報の要約と公開:RSS
- ライセンス記述の新しい形:Creative Commonsのメタデータ
- 利用者側プロファイルの提供:CC/PPとUAProf
- プライバシーに関するメタデータ:P3P(とりあえず例)
そのほか
- セマンティック・ウェブに関連してお話ししたときのXHTMLスライド集
- ちょっとしたメモ(主に2003~2008のセマンティック・ウェブ黎明期のメモ)
- Instant Metadata - フォームによるメタデータ簡単生成
- および更に簡単ブックマークレット
- Metadata in XHTML - XSLTによるRDFの抽出
- XHTMLからメタデータを自動抽出する
- XHTMLを拡張し、メタデータを直接記述する
- 『RDF/OWL入門』と『セマンティックHTML/XHTML』
- Some experimental works
- 参加しよう(古い断片)
最近の関連情報
planet masakaからセマンティック・ウェブ関連の最新メモ20件を取り出しています。過去の関連メモはRDF on Planet masakaを参照。
2024-04-02
- a simplified Turtle-like profile for JSON-LD lists.w3.org...public-linked-json/2024Ma... 巨大になりすぎているJSON-LDの機能を制限し簡単に扱えるプロファイルを提案。200行程度のJSで処理できるという。仕様編集者たちからはすぐに必要性に賛同する多くのコメントが付いている。graphが使えないので実用的ではないが注目に値する。Githubは github.com/zenomt/jsonld-terse (original post at )
2024-03-31
- Re: How do you document your JSON-LD context files ? lists.w3.org...public-json-ld-wg/2024Mar... JLDコンテクストに説明などを記述する方法はという質問に、いくつかの方法が否定された経緯を説明し、コンテクストに使うURIを(connegで)仕様説明文書にリンクするという案をManuSponyが提示 (original post at )
- RDF Dataset Canonicalization w3.org/TR/2024/PR-rdf-canon-20240326 同型(isomorphic)の確認、直列化に関わらない電子署名、グラフの差分計算、データ更新のためのやり取りなどに用いる正規化が勧告案に。うっかりしていたら昨年11月にCRとなって実装も8つほどテストされている(☞参照) (original post at )
2024-03-12
- ジャパンサーチのとちぎデジタルミュージアム、神戸大学附属図書館DA貴重書、茨城大学デジタルコレクションを新たにRDF化しSPARQLエンドポイントで公開しました。jpsearch.go.jp/rdf/sparql/easy/?query=SE... RDF化済は191データセット、2621万アイテム、約12.8億トリプルとなりました(☞参照) (original post at )
2024-02-29
- RFC 9535: JSONPath: Query Expressions for JSON www.rfc-editor.org/rfc/rfc9535 jqとはまた微妙に違うらしいがまぁとりあえず。十数年かけてRFCになったというような話 fosstodon.org/@underlap/111974106910752216 (original post at )
- RFC 9512: YAML Media Type www.rfc-editor.org/rfc/rfc9512 まだRFCになってなかったのか。基本メディア型はapplication/yaml、ほかのメディア型に接尾辞として+yamlを加えるのもあり (original post at )
2024-02-10
- Web Data Commons - October 2023 webdatacommons.org/structureddata/2023-1... 34億ページ中50.6%に構造化マーク付あり→977億トリプルRDF(前比13%増)。調査した34百万ドメイン中トリプルが抽出できたのは43%、そのうち埋込JSON-LDを使っているのが65%。ドメイン別トリプル数ではkayakが7位、同トリプルありURL数ではhatenablogが8位となっている。ML lists.w3.org...public-schemaorg/2024Feb/...(☞参照) (original post at )
2024-02-06
- ジャパンサーチのデータセットを新たにRDF化しSPARQLエンドポイントで公開しました。大分市デジタルアーカイブ jpsearch.go.jp/rdf/sparql/easy/?query=SE... と上田市公文書館所蔵資料 jpsearch.go.jp/rdf/sparql/easy/?query=SE... の2件です。RDF化済データセットは187となりました(☞参照) (original post at )
2024-01-31
- Modeling Items of Wit and Wisdom lists.w3.org...semantic-web/2024Jan/0051... ストーリーを与えてそれ(のキャラクター)に関するコンテンツをAIによって取得するというstory-based search and recommendationのアイデア。AIは状況モデルとか、ストーリーから抽出したキャラクターのネットワークとか、SNSのネットワークなを使うと。詳しくは www.phoster.com/articles/?p=8455 (original post at )
- corese github.com/Wimmics/corese SPARQLやSCHACLをコマンドライン/GUIで利用したりサーバーを立てたりできるRDFツール。知らないうちにv4.5.0にまで進化していた。DLしてみたけれどJavaのバージョンアップが必要なので後で試す。ML告知 lists.w3.org...public-lod/2024Jan/0008.h...(☞参照) (original post at )
2024-01-30
- Summary of the options on the table lists.w3.org...public-rdf-star/2024Jan/0... 名前付き出現のTurtle構文レベルは概ね合意があるが、triple-terms / descriptorsのようなものを用いて抽象構文に手を加えるかどうか、出現名は複数のトリプルを指示できるか、一体化の強さなどで意見が分かれている模様。各提案のポイントを整理した一覧がPACから(☞参照) (original post at )
- Proposal - atomic reification github.com/afs/rdf-star-notes/blob/main/... AndySの提案した<< e: | :s :p :o >>型構文は概ね受け入れられたがN-Triplesなどでの扱いが難点=各SPOの具体化文が別ファイルに別れたりすると破綻する→これを常に一体化する整形式(well-formed RDF)あるいはアトム具体化の提案。これを名前付き出現(named occurence)として扱う。N-Triplesでは:e rdf:occurrenceOf <<( :s :p :o )>> .という形。MLは lists.w3.org...public-rdf-star/2024Jan/0...(☞参照) (original post at )
2024-01-29
- 野矢茂樹「言語哲学がはじまる」を読んだ。フレーゲの述語=命題関数はその真偽値が文の意味、ただしそれは外延であって置き換え可能な固有名の意味を示すには意義(内包)を使うという。それに対してラッセルは確定記述を用いを命題関数に読み替える=記述理論(DL!)を導入、固有名は「これ」「あれ」に行きつくとする。ウィトゲンシュタインは対象の代理としての言語を考え、文によって可能な事実=事態、そして対象がどの可能的事態/語に現れ得るかを論理形式、その可能な世界の集合を論理空間とする、など。おぉまさにRDFの世界ではないか。論理記号を一切使わず噛み砕いて対話的に語っており、すこぶる読みやすい。しかしKindle版は検索もマークもできないのか… (original post at )
2024-01-14
- WaaaT : Wikipedia article as a timeline observablehq.com/@pac02/waaat Wikipedia記事の内部リンクを集め、WikidataのP585を使って年表を生成するというもの。人物より事象のほうがうまくいく感じ (original post at )
2024-01-05
- Wikidata:Ontology issues prioritization www.wikidata.org/wiki/Wikidata:Ontology_... Wikidataオントロジーの問題解決に関するページ。pfpsのML投稿に他のポインタも含めて説明と参加要請が lists.w3.org...semantic-web/2024Jan/0005...(☞参照) (original post at )
- lid: scheme structure data.is4.site/lid/structure SPARQLクエリを簡潔にURI部品として記述するという案。エンドポイントがhostのみしか書けないので使いにくい感じ。いちおうIETFのURIスキーム登録を申請しているらしい。MLは lists.w3.org...semantic-web/2024Jan/0004... (original post at )
2023-12-28
- Consolidating triple/edges lists.w3.org...public-rdf-star-wg/2023De... RDF-starの引用トリプルに出現名を<< occurrenceName | :s :p :o >>という具合に付与するというAndySの提案。グラフ名はデータ管理にも使われている(そうだ!)、複数エッジの注釈が必要(ラベル付プロパティグラフの要望)などの意見に対応する。そしてトリプルはグラフ(集合)の中では単一。言明する注釈構文も基本的に同じ。12/21の定例会議でRDFnとの関連も含めて議論されかなり収束してきたというところか(☞参照) (original post at )
- An outline of RDFn -- RDF with (auto- and custom-) names lists.w3.org...public-rdf-star-wg/2023No... オラクルのSouriから5番目の要素として文の名前nを加えた<s, p, o, g, n>という案の説明とスレッド。元は2020年の blogs.oracle.com/oraclespatial/post/rdfn... 12/7の定例会議でもグラフ述語か引用トリプルか結論が出ない中で一つの有力案に(☞参照) (original post at )
- RDF satar WG Meeting minutes 2023-11-16 www.w3.org/2023/11/16-rdf-star-minutes.h... 主語、目的語の位置に引用トリプル(あるいはtriple term)を置いてそれを型として扱うか、グラフ術語(graph term)と考えるのかと議論→名前付きグラフは仕様では意味未定義でもすでにさまざま使われておりそれを覆すようなのはNG、みなが受け入れられるものを目指すということで結論出ず。継続でniklaslの長い選択肢投稿をTLが整理 lists.w3.org...public-rdf-star-wg/2023No...(☞参照) (original post at )
- Re: expanding work from quoted triples to graph terms lists.w3.org...public-rdf-star-wg/2023Oc... RDF1.2の引用トリプルを空白ノードIDあるいは空白ノード文を使ったグラフ(graph term=グラフ術語?)に変更する、あるいは出現(occurrence)もしくは空白グラフ(blank graph)と呼ぶなど仕様草案の書き換えも含めて議論=10月(☞参照) (original post at )