diff --git a/src/content/ja/2024/structured-data.md b/src/content/ja/2024/structured-data.md new file mode 100644 index 00000000000..5c48a32f139 --- /dev/null +++ b/src/content/ja/2024/structured-data.md @@ -0,0 +1,828 @@ +--- +#See https://github.com/HTTPArchive/almanac.httparchive.org/wiki/Authors'-Guide#metadata-to-add-at-the-top-of-your-chapters +title: 構造化データ +description: 2024年版 Web Almanacの構造化データの章では、RDFa、Open Graph、Twitter、JSON-LD、Microdata、Facebook、Dublin Core、Microformats、microformats2の構造化データの採用状況と前年比の変化について解説しています。 +hero_alt: Web Almanacのキャラクターが財布から身分証明書を取り出し、それをウェブページに差し込んでいるヒーロー画像。 +authors: [cyberandy] +reviewers: [jvandriel, rrlevering] +analysts: [nrllh] +editors: [capjamesg] +translators: [ksakae1216] +cyberandy_bio: WordLiftのCEOであるAndrea Volpiniは、SEOとニューロシンボリック人工知能の交差点で先駆的な進歩を遂げ、セマンティックテクノロジーとAI駆動のコンテンツ発見における革新を推進しています。 +results: https://docs.google.com/spreadsheets/d/1GWniSGupK6KgME7urV7ff0iWStzopGXqnQvJ3_-ynD4/ +featured_quote: ウェブの未来は、構造化され、セマンティックで、ますますインテリジェントになっています。今日、構造化データに投資する組織は、検索での可視性を向上させるだけでなく、AI発見における成功の基盤を構築しているのです。 +featured_stat_1: 7% +featured_stat_label_1: 2022年から2024年にかけてのJSON-LDの採用成長率 +featured_stat_2: 64% +featured_stat_label_2: Open Graph構造化データを実装しているページの割合 +featured_stat_3: 45% +featured_stat_label_3: Twitter(X)構造化データを実装しているページの割合 +doi: 10.5281/zenodo.14065771 +--- + +## はじめに + +私たちは、セマンティックウェブの進化における重要な時期を迎えています。AIは広く利用可能になり、多くの日常的なアプリケーションに統合されています。この章は3年目を迎え、過去1年間のトレンドを分析し、時間とともに急速に進展する状況を検証する貴重な機会を提供します。これまでの版を振り返ることで、構造化データの現状と今後の方向性について包括的な視点を提供できます。 + +## 拡大する構造化データの展望 + +過去18ヶ月間で、構造化データの状況は大きく変化しました。2023年、Googleは検索エンジン結果ページ(SERP)から `FAQ` と `HowTo` のリッチリザルトを廃止しました([参照](https://developers.google.com/search/blog/2023/08/howto-faq-changes))。2024年11月には、検索結果からサイトリンク検索ボックスも削除される予定です([参照](https://developers.google.com/search/docs/appearance/structured-data/sitelinks-searchbox))。しかし、それと並行して、GoogleとBingの両方で構造化データの使用に関する新しい革新と拡大の波が起きています。 + +### **2023-2024年の主要な進展:** + +1. **新しい構造化データタイプ**: Googleは、車両リスト、コース情報、バケーション賃貸、製品の3Dモデルなど、いくつかの新しいタイプを導入しました。また、eコマース分野では、Googleは特にMerchant CenterとSchema.orgを通じて、ロイヤリティプログラムを構造化データの提供に統合しました。 + +2. **既存タイプの強化**: 組織データ、製品バリアントの改善、割引リッチリザルトの導入。 + +3. **構造化データカルーセル**: `ItemList` と他のタイプを組み合わせた構造化データカルーセルのベータ版がリリースされ、GoogleのSERPで新しいコンテンツ表示の可能性が開かれました([参照](https://developers.google.com/search/docs/appearance/structured-data/carousels-beta))。 + +4. **GS1統合**: GS1 Digital LinkなどのGS1標準のサポートが強化され、物理的およびデジタル製品情報のギャップを埋めることを目指しています。この技術により、メーカーと小売業者はQRコードを通じて物理製品とデジタルIDを接続できます。スキャンすると、これらのコードは包括的な製品情報へのアクセスを提供し、透明性と顧客エンゲージメントを向上させます。また、`gs1:CertificationDetails`プロパティは、Googleによって`schema:Certification`として正式に採用され、業界固有の拡張機能がSchema.org標準に影響を与え、統合できることを示しています。 + +5. **検索アプリケーションを超えたセマンティックデータ**: 構造化データは、従来の検索エンジンを超えて、ソーシャルウェブアプリケーションで重要な役割を果たすようになっています。たとえば: + + - **ID検証**: Mastodonなどのプラットフォームは、双方向のID検証に`rel=me`リンクを使用しています(参照)。 + - **連合ソーシャルネットワーク**: `rel=me`の使用により、Mastodonユーザーはサードパーティのウェブサイト(例:Ghost)でアカウントを検証でき、クロスプラットフォームのIDを強化しています(Ghostでのrel=meに関する議論)。 + - **新しいジャーナリズム機能**: Mastodonは最近、ジャーナリストと出版社のためのコンテンツ検証をサポートするために`fediverse:creator`属性を導入しました(参照)。 + +## 従来の実装を超えて + +構造化データのエコシステムが成熟するにつれて、実装戦略の多様化が進んでいます。検索エンジンが構造化データの主要な消費者である一方で、その応用は大幅に拡大しています: + +1. **マークアップとしてのSchema.org**: ウェブページに直接構造化データを埋め込む従来の方法は、現代のSEOプラクティスの基盤であり続けています。 + +2. **データ標準としてのSchema.org**: + HTMLでの使用を超えて、Schema.orgはAPIやフィードを通じて共有されるデータの標準化にますます活用されています。たとえば、GoogleのData Commonsイニシアチブは、拡張されたSchema.org語彙を使用して、世界中の数百の組織からのデータセットを統合しています。この標準化は、データセットの発見や関係性のマッピングなどのタスクをサポートし、AI駆動環境でのデータセットの出所、サブセット、派生の理解に重要です(参照)。 + +3. **ソーシャルウェブアプリケーションでのセマンティックデータ**: + + - Mastodonなどのプラットフォームは、ID検証に構造化データを活用しています。`rel=me`属性により、ユーザーは連合ネットワーク間でアカウントを検証できます(参照)。 + - `fediverse:creator`などの機能は、コンテンツと著者を検証するために使用され、分散型ソーシャルウェブでの信頼性を向上させています(参照)。 + +4. **デジタル製品パスポート(DPP)**: + +構造化データは、EUのデジタル製品パスポートなどの新興の規制要件において重要な役割を果たしています。これは、eコマースにおける透明性と持続可能性を向上させるために設計されています。これらのパスポートは、GS1 Digital Linksを活用して、QRコードを通じて包括的な製品情報を提供します。 + +5. **AI駆動のディスカバリーのための構造化データ**: + +AI駆動の検索エンジン、チャットボット、会話型アシスタントがその範囲を拡大し続ける中、構造化データは、これらのプラットフォーム全体でコンテンツの発見可能性と文脈理解を向上させる上で重要な役割を果たしています。主な例としては: + + - **AI検索エンジン**: Bing ChatやGoogle AI Overviewなどのプラットフォームは、構造化データを活用して言語モデルを訓練するだけでなく、文脈的に豊かで正確な応答を提供しています。構造化データを活用することで、これらのシステムはデータセット間の複雑な関係を解釈し、検索の関連性を向上させ、ユーザーが相互接続されたデータセットをシームレスにナビゲートできるようにしています(参照)。 + +これらの機能は、構造化データが発見可能性の向上だけでなく、AIシステムがデータ間の関係を解釈し、それに基づいて行動する能力を向上させる上で、進化する役割を示しています。これにより、より豊かで有用なユーザー体験が生まれます。 + +この多様化は、構造化データがデータの相互運用性、社会的信頼、規制遵守、AI駆動のコンテンツ発見を促進する上で、ますます重要な役割を果たしていることを示しています。システムがデータ間の複雑な関係を理解し、それに基づいて行動できるようにすることで、構造化データはより豊かで、よりインテリジェントなデジタル体験の基盤を築いています。 + +## AIと機械学習時代における構造化データ + +生成AIと高度な機械学習の登場により、構造化データの重要性がさらに強調されています: + +- **事実の検証**: 構造化データは、AIシステムにとって解析可能なソースを提供し、情報を効率的に抽出、解釈、検証することを可能にします。これにより: + - **偽情報の対策**: AIは、構造化データを信頼できる他のソースと相互参照することで、事実を検証できます。 + - **コンテンツの理解の向上**: 明確なエンティティの定義と関係を提供することで、構造化データは複雑なトピックの解釈を支援します。 + - **ユーザー体験の向上**: 構造化データにより、チャットボットや音声アシスタントなどのAIシステムは、ユーザーのクエリに対して正確で文脈的に豊富な応答を提供できます。 +- **検索理解の強化**: 構造化データにより、検索エンジンやAI駆動システムがコンテンツをより洗練された方法で解釈できます。 +- **機械学習のトレーニングデータ**: 構造化データは、高品質の機械学習モデルのトレーニング材料です。 + +## この章が提供するもの + +この章では、2023-2024年の構造化データのトレンドについてデータ主導の分析を行い、主要な発展とベストプラクティスを紹介します: + +1. **ランドスケープの進化**: + + - Google AI OverviewやBing ChatなどのAI駆動検索の増加に伴う構造化データの主要な変化。 + - GoogleとBingの構造化データポリシーの変化と、SEOへの影響。 + +2. **普及と成長**: + + - JSON-LD、Microdata、RDFaなどの一般的な形式のトレンド。 + - `Product`、`Organization`、`Article`などのスキーマタイプの採用率。 + +3. **実装とベストプラクティス**: + + - JSON-LDの使用など、構造化データのベストプラクティス。 + - 一般的な間違いとその回避方法。 + +4. **リッチリザルトとSERP機能**: + + - `FAQ`や`HowTo`などの廃止された機能の影響。 + - カルーセルや製品知識パネルの導入。 + +5. **AI駆動検索**: + + - AI駆動検索や音声アシスタントにおける構造化データの役割。 + - AI駆動コンテンツ発見のトレンド。 + +6. **eコマースの革新**: + + - デジタル製品パスポートやGS1デジタルリンクの成長。 + - eコマースや新しいリッチリザルトタイプにおける構造化データの役割。 + +7. **知識グラフとグラフRAG**: + + - 知識グラフとグラフRAGがAI出力の強化においてどのように重要になっているか。 + +8. **データの品質と整合性**: + + - 高品質の構造化データを維持するためのベストプラクティス。 + +9. **新しいスキーマとユースケース**: + + - SEOやeコマースにおけるスキーマタイプの革新とその適用。 + +10. **将来の展望**: + + - 構造化データがAI、セマンティックSEO、コンテンツ発見においてどのように進化していくか。 + +この章では、SEO、AI、eコマースにおける構造化データの影響について包括的な視点を提供し、開発者やマーケターに実行可能な洞察を提供します。 + +## 主要概念 + +構造化データが複雑さを増している中、分析を進める前に重要な概念を探求し、説明することが重要です。このセクションでは、分野の基本的な考え方と最近の発展を概説します。 + +### リンクデータとセマンティックウェブ + +リンクデータは、構造化データの基礎をなすものです。ウェブページに構造化データを追加し、参照されたエンティティにURIリンクを提供することで、情報の相互に結びついたウェブを作り出します。これにより、リソース記述フレームワーク(RDF)を介してウェブページをデータベースとして扱えるセマンティックウェブを支援します。 + +セマンティックトリプル(主語-述語-目的語)の概念は、エンティティ間の関係を表現する上で基本的です。[SPARQL](https://wikipedia.org/wiki/SPARQL)は、グラフデータやRDFトリプルをクエリするための特定の言語で、[GraphQL](https://wikipedia.org/wiki/GraphQL)は、さまざまなバックエンド(データベースやマイクロサービスを含む)から構造化データを取得するための柔軟なAPIクエリ言語です。これらのツールは相互に補完し、SPARQLはセマンティックウェブアプリケーションにおけるRDFデータセットのクエリに優れ、GraphQLはウェブやモバイルアプリケーションにおける構造化データへのアクセスを簡素化します。 + +#### オープンデータと5つ星モデル + +ティム・バーナーズ=リーのオープンデータモデルの5つ星は、依然として重要です。それは、ウェブで利用可能、構造化、非専有、URI識別、相互リンクされたデータの重要性を強調しています。構造化データは、このモデルのより高いレベル達成で重要な役割を果たし、よりオープンで相互接続されたウェブエコシステムに貢献します。 + +### AI検索、音声アシスタント、デジタルアシスタント + +AI、LLM、高度な自然言語処理の統合により、検索とデジタルアシスタンスの状況は劇的に進化しています。この収束により、従来の検索エンジン、音声起動システム、AI駆動のデジタルアシスタントの境界線が曖昧になっています。 + +#### セマンティック検索エンジンとAI駆動検索 + +セマンティック検索は、従来のキーワードマッチングを超えて、高度なAI駆動のエクスペリエンスを含むようになりました。これらのシステムは構造化データを活用して、より正確で文脈に即した、対話的な検索結果を提供します。主な進展は以下の通りです: + +- Google AI Overview:複雑なトピックに関する包括的な(時に誤解を招く)AI生成サマリーを提供する機能。 +- Microsoft Bing Chat:Bing検索結果に直接チャットベースのAIインタラクションを統合。 +- Meta AI:Facebook、Messenger、Instagram、WhatsAppなどのプラットフォーム全体に統合されたMetaのAIアシスタント。 +- SearchGPT(およびChatGPT):検索結果を対話型レスポンスに統合するOpenAIのAI検索エンジン。 +- Perplexity.ai:詳細なソース付きの回答を提供するAI駆動の検索エンジン。 +- You.com:AIによる要約検索結果とより対話的な検索のためのチャットインターフェースを提供。 + +これらのプラットフォームは、ユーザーの意図と文脈を理解する能力が向上し、検索の精度とユーザー体験を大幅に改善しています。従来のウェブインデックスと、リアルタイムの情報検索、自然言語生成を組み合わせることが多いです。 + +### 構造化データの役割 + +構造化データは、これらのAI駆動システムで以下のような重要な役割を果たしています: + +1. **エンティティ認識の強化**:クエリで言及されたエンティティを正確に識別し、曖昧さを解消するのに役立ちます。 +2. **文脈の提供**:エンティティとその関係に関する追加情報を提供し、応答の精度を向上させます。 +3. **知識グラフ統合の促進**:これらのシステムが膨大な相互接続された情報データベースにアクセスできるようにします。 +4. **リッチレスポンスの実現**:視覚要素やインタラクティブな機能を含む、詳細で多面的な回答の生成をサポートします。 +5. **音声クエリ解釈の改善**:テキストベースの検索よりも曖昧になりやすい音声クエリの意図を理解するのを支援します。 + +生成AIとAI検索エンジンにおける構造化データの影響を評価するのは依然として困難ですが、地理参照クエリなどの場合、Perplexity.aiやYou.comのユーザー体験でエンティティの初期的な出現を観察できます。 + +{{ figure_markup( + image="structured-data-perplexity.png", + caption="Perplexityの検索結果で、地図表示と地域のレストラン一覧を表示。", + description="Perplexityのユーザーインターフェースで、星評価、住所、地図を含むローカルレストランの検索結果を表示。", + width=400, + height=258 + ) +}} + +{{ figure_markup( + image="structured-data-you-com.png", + caption="You.comの検索結果で、地図とレストラン一覧を表示。", + description="You.comのインターフェースで、Mariapfarrのレストラン検索結果を評価と地図の位置情報とともに表示。", + width=400, + height=204 + ) +}} + +これは、Bing CopilotやGoogleのGeminiと対話する際により一貫性が見られます。 + +{{ figure_markup( + image="structured-data-google-gemini.png", + caption="Google Gemini。", + description="Google Geminiのスクリーンショットで、画像、評価、地図統合を含むレストランのレコメンデーションを提供。", + width=386, + height=335 + ) +}} + +{{ figure_markup( + image="structured-data-via-culinaria-bing.png", + caption="Bing Copilot。", + description="Bing Copilotのスクリーンショットで、地図統合、評価、TripAdvisorのレビューを含むローカルレストラン情報を表示。", + width=400, + height=296 + ) +}} + +実証的に、上記で見られるように、AI駆動の検索システムは、さまざまな確立された知識ベースと権威あるプラットフォームからデータを取得しています: + +- 地図サービス:Google MapsとBing Mapsは、位置情報の重要なデータソースとして機能しています。 +- 権威あるウェブサイト:TripAdvisorなどの構造化データマークアップが豊富なプラットフォームは、AI検索システムの知識ベースに大きく貢献しています。 +- 業界固有のデータベース:業界固有のデータベースとプラットフォームは、さまざまな分野でAI駆動検索のための専門情報を提供しています。 + +### AI駆動検索への移行とその影響 + +従来の検索からAI駆動検索へのこの移行は、より広範で洗練された最適化アプローチを要求します: + +1. **マルチプラットフォーム可視性**: +SEO戦略は、以下のような多様なAIサーフェスとプラットフォーム全体での可視性を考慮する必要があります: + + - 従来の検索エンジン(Google、Bing) + - AIチャットボット(ChatGPT、GoogleのGemini、Perplexity、AnthropicのClaude) + - 統合アシスタント(Microsoft Copilot、Apple-ChatGPT統合の可能性) + - エコシステム固有のツール(Google Workspace、Microsoft 365) + - ブラウザとデバイスレベルの統合 + +2. **従来の最適化を超えて**: +この状況での成功は、GoogleのAI Overviewなどの特定の機能の最適化を超えています。すべての新興検索インターフェースでコンテンツを発見可能で理解しやすくするための包括的なアプローチが必要です。 + +3. **構造化データの戦略的活用**: +可視性の向上の鍵は、スキーママークアップを使用して構造化データを公開するだけでなく、ビジネスやコンテンツにとって重要なエンティティに関する構造化情報へのアクセスを促進することにあります。これには以下が含まれます: + + - 明確な構造化情報が利用可能で、さまざまなAIシステムが容易に解釈できることを確保する。 + - ボット用のウェブページを説明するメタデータが、人間の読者に提示されるコンテンツと一致していることを確保する。 + - 製品やサービスに関する正確な情報を、関連するプラットフォームやマーケットプレイス(例:Google Merchant、Amazon)に直接提供する。 + +## リッチリザルトとナレッジパネル + +構造化データによって実現されるリッチリザルトとナレッジパネルは、検索エンジン結果ページ(SERP)の重要な機能です。これらの拡張表示は、ユーザーに即座に関連性の高い情報を提供し、クリック率とユーザーエンゲージメントを大幅に向上させます。リッチリザルトがより多様で洗練されるにつれて、コンテンツの可視性に対する新たな機会が生まれています。Googleからの最近の例として、ローカルビジネス(レストラン、ホテル、バケーション賃貸などのサブタイプを含む)、製品、イベントに関連するリスト記事ページ向けの構造化データカルーセルの導入があります。 + +{{ figure_markup( + image="structured-data-image-carousel.png", + alt="Googleの構造化データカルーセル", + caption="新しいベータ版カルーセルリッチリザルトの例", + description="Googleの構造化データカルーセルを示す画像", + width=1600, + height=604 + ) +}} + +このカルーセル形式は、リスト記事ページの構造化データの表示を強化し、ローカルビジネスや製品などの複数のオプションにSERP上で直接アクセスできるようにします。 + +構造化データに直接影響されないもう1つの注目すべき例は、新しいGoogle Merchantナレッジパネルです。これは製品ナレッジグラフパネルの機能を拡張します。構造化データは、エンティティの曖昧性解消に貢献するシグナルとして機能し、検索エンジンがビジネスとその属性を正確に識別するのを支援し、これらのパネルの表示につながる可能性があります。この機能は、大小を問わず、ビジネスがGoogleの検索結果ページに直接販売者の重要な情報を表示することで、ユーザーとの信頼関係を構築するのに役立ちます。 + +## ナレッジグラフとGraph RAG + +ナレッジグラフは、構造化データアプリケーションにおいてますます中心的な役割を果たすようになり、正確で明示的なトリプル表現を通じて事実情報をカプセル化しています(参照)。これらは、エンティティ間の複雑な関係を表現し、クエリを実行するための強力な方法を提供すると同時に、透明な記号的推論機能を提供します。Graph RAG(Retrieval-Augmented Generation)の出現は、ナレッジグラフと大規模言語モデルを組み合わせて、検証可能な構造化情報でAI生成の応答を強化し、LLMに内在する事実の不整合や不透明性の課題に対処する重要な進展を表しています。 + +### ラベル付きプロパティグラフとRDFグラフの違い + +ラベル付きプロパティグラフ(LPGs)とResource Description Framework(RDF)グラフは、データを整理し表現する2つの異なるアプローチです。Neo4jなどのデータベースで一般的に使用されるLPGsは、ノードと関係でデータを構造化し、それぞれがラベルとプロパティを持ちます。これにより、複雑なデータ関係を柔軟で直感的にモデル化できます。一方、セマンティックウェブの基盤となるRDFグラフは、トリプルベースの構造(主語-述語-目的語)を使用してデータを表現します。RDFは相互運用性と標準化を重視し、異なるシステムやドメイン間でデータをリンクするのに理想的です。LPGsが特定のアプリケーションで使いやすさとパフォーマンスを提供する一方、RDFはセマンティックデータの統合と推論のための堅牢なフレームワークを提供します。 + +ナレッジグラフの作成における構造化データの重要性は、いくら強調してもしすぎることはありません。構造化データは、エンティティとその関係を正確に定義することを可能にし、正確で信頼性の高いナレッジグラフの開発に不可欠です。構造化データを活用することで、組織はデータの発見可能性、相互運用性、AI生成の洞察の全体的な品質を向上させる包括的なナレッジグラフを構築できます。 + +## Data Commons + +Data Commonsは、Googleによるオープンソースかつオープンデータのイニシアチブで、国連や各国の国勢調査局など、さまざまなグローバルソースからの公開データセットを整理し、普遍的にアクセス可能にします。このプラットフォームは、2500億以上のデータポイントと2.5兆のトリプルを提供し、幅広い統計変数を網羅しています。Data Commonsでは、Schema.orgを使用して構造化データをエンコードし、多様なデータセットを標準化・正規化する統一されたナレッジグラフを作成し、共通のフレームワークを通じてより簡単なアクセスと探索を可能にします。この構造化されたアプローチは、膨大な量のデータを一貫性のある検索可能なシステムに統合するのに役立ちます。 + +## デジタル製品パスポートとGS1デジタルリンク + +eコマースとサプライチェーン分野では、デジタル製品パスポート(DPPs)とGS1 Digital Link標準が、製品情報の共有とアクセス方法に革命をもたらしています。これらの技術は、構造化データを活用して、物理的な製品の包括的で簡単にアクセス可能なデジタル表現を作成し、トレーサビリティ、サステナビリティへの取り組み、消費者情報へのアクセスを向上させています。 + +## AI、機械学習、構造化データ + +構造化データとAI/MLの相乗効果は深まっています。構造化データは、機械学習モデルのトレーニングにおいて、一貫性のある機械可読なラベルを提供する上で重要です。とくに以下の分野で重要です: + +- **大規模言語モデル(LLMs)**:特定のドメインでの性能向上のための構造化データによるファインチューニング。 +- **説明可能なAI**:ナレッジグラフを使用してAIの意思決定プロセスを追跡・説明する。 +- **マルチモーダルAI**:AIシステムで異なるデータタイプ(テキスト、画像、動画)をリンクする。 + +## セマンティックSEOとデータ品質 + +SEOは、単純なキーワードマッチングを超えて、現在ではセマンティックSEOと呼ばれるものに進化しています。この現代的なアプローチは、構造化データと文脈理解を活用して、検索エンジンがより正確な結果を提供できるようにします。構造化メタデータを実装し、トピック間の関係性に焦点を当てることで、ウェブサイトはコンテンツにより深い意味を構築できます。これにより、GoogleやBingなどの検索エンジンは、単なるキーワードの頻度を数えるだけでなく、ユーザーの意図をよりよく理解できるようになります。 + +セマンティックSEOを実装することで、企業はトピックに基づいてコンテンツクラスターを作成でき、個々のキーワードだけでなく、音声検索アシスタントを含むさまざまな検索プラットフォームでコンテンツをより発見しやすく、文脈的に関連性の高いものにできます。この手法は、構造化データにより検索エンジンがコンテンツをより詳細なレベルで理解し、ユーザーの意図とのマッチングを容易にすることで、検索エンジンのランキングとユーザーエンゲージメントを大幅に向上させます。 + +データ品質もここで重要な役割を果たします。高品質な構造化データは、検索エンジンだけでなく、誤情報との戦いにおいても重要な一貫性と正確性を確保します。これは、構造化データが事実の検証やLLMのトレーニング強化などのAI駆動システムでますます使用されるようになるにつれて、ウェブ全体での信頼性を維持するのに役立ちます。 + +たとえば、EssilorLuxottica、L'Oréal、Wallmart、Shiseidoなどの組織は、ナレッジグラフなどのセマンティックテクノロジーを使用してコンテンツをリンクし、ユーザーにより詳細で文脈的に関連性の高い結果を提供しています。この実践は、AI駆動のコンテンツ発見を支援し、PerplexityやYou.comなどの生成検索を通じてコンテンツをより簡単に取得できるようにします。 + +セマンティックSEOに投資し、高品質な構造化データを維持することは、検索での可視性を向上させるだけでなく、AI駆動の発見のためのコンテンツの将来性を確保する基盤を築きます。 + +## 1年の振り返り + +構造化データの実装状況は進化し続けています。この状況をよりよく理解するために、 _構文/エンコーディング_ と _語彙_ を区別することが重要です: + +- **構文/エンコーディング**: これらはウェブページに構造化データを埋め込む方法を定義します: + - **RDFa**: 強い存在感を維持し、66% のページで使用されています。 + - **JSON-LD**: 人気が高まっており、41% のページで実装されています。 + - **Microdata**: 安定した使用率で、26% のページで使用されています。 + - **HEAD データ**: Twitter Cards のような非 RDFa メタタグを含みます。 + +- **ボキャブラリー**: これらはデータの意味とセマンティクスを定義します: + - **Open Graph Protocol (OGP)**: 広く使用されているボキャブラリーで、多くの場合 RDFa としてエンコードされています(64% のページ)。 + - **Twitter メタタグ**: 急速に拡大し、45% のページで使用されています。 + - **Schema.org**: 複数の構文で使用される柔軟なボキャブラリーです。 + - **Dublin Core**: ニッチなユースケースで、通常 RDFa としてエンコードされます。 + - **Microformats**: 主にクラスベースのメタデータとして実装されています。 + +### 構造化データの使用トレンド(2022-2024年) + +データは構文と語彙の使用において注目すべきトレンドを示しています: + +- **RDFaとOpen Graph**: 支配的で、それぞれ66%と64%のページで採用されています。 +- **JSON-LD**: 上昇傾向を続け、2022年の34%から2024年には41%に増加しました。 +- **Twitterメタタグ(HEADデータ)**: 大幅な成長を見せ、現在45%に達しています。 +- **Microdata**: 26%で安定しており、主にレガシーコンテキストで使用されています。 +- **Facebookメタタグ**: 7%に減少し、Open Graphへの移行を反映しています。 +- **Dublin CoreとMicroformats**: 最小限の使用で、それぞれ1%未満です。 + +{{ figure_markup( + image="structured-data-usage-by-year-mobile.png", + caption="モバイル向けの構造化データ使用状況(年別)", + description="棒グラフは、2021年と2022年のモバイルページでの構造化データの使用状況を示しています。RDFaは2021年に61%、2022年に62%、Open Graphはそれぞれ57%と59%、Twitterは37%と40%、JSON-LDは34%と37%、Microdataは25%と25%、Facebookは8%と8%、Dublin CoreとMicroformatsは両年とも1%、microformats2は両年とも0%でした。", + chart_url="https://docs.google.com/spreadsheets/d/e/2PACX-1vTE7UqINKaCzsmdVSUPZhQjlm2Az5T9wcbk4ZMZyJu-Rp8JWXtn9YRfXnAajUqQYLTCnSA2O5FEP6YF/pubchart?oid=1720156114&format=interactive", + sheets_gid="560419533", + sql_file="present_types.sql", + width=600, + height=441 + ) +}} + +{{ figure_markup( + image="structured-data-usage-by-year-desktop.png", + caption="デスクトップ向けの構造化データ使用状況(年別)", + description="棒グラフは、2022年と2024年のデスクトップページでの構造化データの使用状況を示しています。RDFaは2022年に約60%、2024年に62%、Open Graphは2022年に57%、2024年に59%、Twitterは2022年に37%、2024年に40%、JSON-LDは2022年に34%、2024年に37%、Microdataは25%で安定、Facebookは8%から7%にわずかに減少、Dublin Core、Microformats、Microformats2は最小限の使用率で、両年とも1%未満でした。", + chart_url="https://docs.google.com/spreadsheets/d/e/2PACX-1vTE7UqINKaCzsmdVSUPZhQjlm2Az5T9wcbk4ZMZyJu-Rp8JWXtn9YRfXnAajUqQYLTCnSA2O5FEP6YF/pubchart?oid=1466312390&format=interactive", + sheets_gid="560419533", + sql_file="present_types.sql" + ) +}} + +デスクトップとモバイルの実装におけるプラットフォームの差異は減少しており、デバイス間での標準化された構造化データ戦略への移行を示唆しています。この傾向は、検索エンジンとAIシステムがコンテンツの理解と表示を向上させるために構造化データへの依存度を高めていることと一致しています。 + +### JSON-LD、Microdata、RDFaの使用状況の比較 + +3つの主要な構造化データ形式は、それぞれ異なる採用パターンを示しています: + +- **RDFa**: もっとも高い採用率で、全ページの66%で使用されています。レガシーCMSプラットフォームで広く使用されており、主な実装例は以下の通りです:ナビゲーション要素(パンくずリスト)、基本的なページ構造、画像とドキュメントのメタデータ、リスト項目 +- **JSON-LD**: 全ページの41%で使用されています(2022年の34%から増加)。3つの形式の中で最も急速に成長しており、Googleが推奨し、開発者の採用も広がっています。主に以下の用途で使用されています:組織データ、ローカルビジネス情報、製品リスト、記事やクリエイティブ作品 +- **Microdata**: 全ページの26%で使用されています。安定した成長を見せていますが、速度は遅めです。主に以下の用途で使用されています:ウェブページ構造(8.34%のページ)、サイトナビゲーション(6.42%)、ヘッダーとフッター(5.97%と5.33%)、組織情報(4.87%) + +各タイプについて、より詳細に分析してみましょう。 + +## RDFa + +RDFaは、とくにレガシーCMSプラットフォーム内で、構造化データにおいて重要な役割を果たし続けています。しかし、`listitem`や`breadcrumblist`などのナビゲーション要素にRDFaを使用する傾向が顕著に増加しており、現在では多くのウェブページで一般的になっています。これは、とくにモバイルプラットフォームでのユーザー体験向上のために、構造化されたナビゲーションデータを強化することに業界全体が重点を置いていることを反映しています。 + +対照的に、`foaf:image`や`foaf:document`などの従来のRDFaタイプの使用は減少傾向にあります。これは、JSON-LDやOpen Graphなどの新しい形式が、画像やドキュメントのメタデータに対してより柔軟なソリューションを提供しているためです。RDFa内での`schema:webpage`などのSchema.orgタイプの採用は控えめながらも安定した成長を示しており、Schema.org語彙への移行がさらに進んでいることを示しています。 + +{{ figure_markup( + image="rdfa-usage-by-year.png", + caption="モバイル向けのRDFa使用状況(年別)", + description="2022年と2024年のモバイルページでのRDFa使用状況を示す棒グラフ。foaf:imageは0.49%で安定し、foaf:documentは0.23%から0.16%に減少しました。sioc:itemとschema:webpageはそれぞれ0.16%と0.10%で安定しています。listitemとwebpageは顕著な成長を見せ、2022年の低い水準から2024年には0.82%に増加しました。breadcrumblistの使用率は0.45%に増加しました。v:breadcrumbやsioc:useraccountなどの他のプロパティは0.05%未満の最小限の使用率でした。", + chart_url="https://docs.google.com/spreadsheets/d/e/2PACX-1vTE7UqINKaCzsmdVSUPZhQjlm2Az5T9wcbk4ZMZyJu-Rp8JWXtn9YRfXnAajUqQYLTCnSA2O5FEP6YF/pubchart?oid=408467656&format=interactive", + sheets_gid="560419533", + sql_file="present_types.sql", + width=600, + height=550 + ) +}} + +{{ figure_markup( + image="rdfa-usage-by-year-desktop.png", + caption="デスクトップ向けのRDFa使用状況(年別)", + description="2022年と2024年のデスクトップページでのRDFa使用状況を示す棒グラフ。foaf:imageはもっとも使用されており、2022年と2024年で1.22%でした。foaf:documentの使用率は0.40%から0.38%にわずかに減少し、sioc:itemやschema:webpageなどの他のタイプは最小限の変動を示しました。とくに、listitemの使用率は2022年の0.39%から2024年には0.60%に大幅に増加し、webpageの使用率も2024年には0.70%に上昇しました。breadcrumblistやv:breadcrumbなどの他のタイプは0.50%未満で、sioc:useraccountは最小限の採用率を示しました。", + chart_url="https://docs.google.com/spreadsheets/d/e/2PACX-1vTE7UqINKaCzsmdVSUPZhQjlm2Az5T9wcbk4ZMZyJu-Rp8JWXtn9YRfXnAajUqQYLTCnSA2O5FEP6YF/pubchart?oid=1587094037&format=interactive", + sheets_gid="560419533", + sql_file="present_types.sql", + width=600, + height=441 + ) +}} + +データは、RDFaが依然として有用なツールである一方で、とくに動的コンテンツアプリケーションにおいて、JSON-LDなどの現代的な構造化データ形式に徐々に取って代わられていることを示唆しています。 + +{{ figure_markup( + image="rdfa-usage-by-device.png", + caption="デバイス別のRDFa使用状況(デスクトップ対モバイル)", + description="2024年のデスクトップとモバイルページでのRDFa使用状況を比較する棒グラフ。foaf:imageはモバイル(0.49%)と比較してデスクトップ(1.22%)でより高い使用率を示しています。foaf:documentとsioc:itemもデスクトップでより高い採用率を示していますが、listitemとwebpageタイプではモバイルの使用率が高く、両方とも0.82%に達しています。breadcrumblist、v:breadcrumb、sioc:useraccountは両デバイスで0.50%未満の使用率にとどまっています。", + chart_url="https://docs.google.com/spreadsheets/d/e/2PACX-1vTE7UqINKaCzsmdVSUPZhQjlm2Az5T9wcbk4ZMZyJu-Rp8JWXtn9YRfXnAajUqQYLTCnSA2O5FEP6YF/pubchart?oid=780422567&format=interactive", + sheets_gid="560419533", + sql_file="present_types.sql", + width=600, + height=493 + ) +}} + +## Dublin Core + +{{ figure_markup( + image="dublin-core-usage-by-year.png", + caption="モバイル向けのDublin Core使用状況(年別)", + description="2022年と2024年のモバイルページでのDublin Core使用状況を示す棒グラフ。dc:titleの使用率がもっとも高く、2024年にはdc.languageとdc.descriptionが顕著に増加しました。dc.sourceやdcterms.titleなどのフィールドも成長を見せましたが、dc.publisherやdc.identifierなどの他のフィールドは比較的安定していました。dcterms.rightsholderやdcterms.identifierなどの専門的なフィールドは両年とも0.002%未満の最小限の使用率でした。", + chart_url="https://docs.google.com/spreadsheets/d/e/2PACX-1vTE7UqINKaCzsmdVSUPZhQjlm2Az5T9wcbk4ZMZyJu-Rp8JWXtn9YRfXnAajUqQYLTCnSA2O5FEP6YF/pubchart?oid=151920898&format=interactive", + sheets_gid="560419533", + sql_file="present_types.sql", + width=600, + height=493 + ) +}} + +{{ figure_markup( + image="dublin-core-usage-by-year-desktop.png", + caption="デスクトップ向けのDublin Core使用状況(年別)", + description="2022年と2024年のデスクトップページでのDublin Core使用状況を示す棒グラフ。dc:titleの使用率が両年とももっとも高く、2024年にはdc.languageとdc.descriptionが増加しました。dc.source、dc.creator、dc.publisherなどのフィールドも中程度の増加を見せましたが、dcterms.identifierやdcterms.rightsholderなどのより専門的なフィールドは最小限の採用率で、0.002%未満にとどまっていました。", + chart_url="https://docs.google.com/spreadsheets/d/e/2PACX-1vTE7UqINKaCzsmdVSUPZhQjlm2Az5T9wcbk4ZMZyJu-Rp8JWXtn9YRfXnAajUqQYLTCnSA2O5FEP6YF/pubchart?oid=1992172544&format=interactive", + sheets_gid="560419533", + sql_file="present_types.sql", + width=600, + height=493 + ) +}} + +Dublin Coreは、とくにJSON-LDやOpen Graphなどの現代的な形式と比較すると、使用頻度は低いものの、安定したメタデータ形式として存在し続けています。 + +{{ figure_markup( + image="dublin-core-usage-by-device.png", + caption="デバイス別のDublin Core使用状況(デスクトップ対モバイル)", + description="2024年のデスクトップとモバイルページでのDublin Core使用状況を比較する棒グラフ。dc:titleはもっとも高い採用率を示し、デスクトップで0.7%、モバイルで0.5%でした。dc.languageやdc.descriptionなどの他のフィールドもデスクトップでより高い使用率を示しています。一方、dc.relationはモバイルで0.3%とより高い割合を示し、dc.identifierやdc.subjectなどの他のフィールドは両デバイスで一貫した使用率を維持していました。", + chart_url="https://docs.google.com/spreadsheets/d/e/2PACX-1vTE7UqINKaCzsmdVSUPZhQjlm2Az5T9wcbk4ZMZyJu-Rp8JWXtn9YRfXnAajUqQYLTCnSA2O5FEP6YF/pubchart?oid=257359995&format=interactive", + sheets_gid="560419533", + sql_file="present_types.sql", + width=600, + height=555 + ) +}} + +`dc.title`や`dc.language`などの主要なフィールドは、年ごとの変化が最小限で、主に学術的およびレガシーなウェブプロジェクトで一貫した存在感を維持しています。 + +`dc.source`の使用の増加は、元のソースの引用に対する重視の高まりを反映しており、`dc.identifier`などのフィールドは依然としてリソース識別に重要です。しかし、`dcterms.identifier`などの専門的なフィールドの採用率は低下しており、Dublin Coreが今日のウェブ環境で中心的な役割を果たしていないことを示しています。 + +興味深いことに、Dublin Coreは多言語ドキュメント管理において、とくに`dc.language`フィールドを通じて関連性を維持しています。このフィールドは、複数の言語でのコンテンツの管理と分類に不可欠であり、ドキュメントメタデータが国際化とローカライゼーションの取り組みをサポートする必要がある文脈で貴重なツールとなっています。 + +全体として、Dublin CoreはJSON-LDなどのより多機能な形式に徐々に取って代わられていますが、構造化されたドキュメントメタデータと多言語サポートが重要なニッチなニーズに対応し続けています。 + +## Open Graph + +Open Graphは、とくに**ソーシャルメディア共有**の文脈で、もっとも広く実装されている構造化データ形式の1つとして存在し続けています。`og:image`タグは依然としてもっとも頻繁に使用されるプロパティであり、ビジュアルコンテンツの最適化に対する重視の高まりを反映しています。`og:image:width`や`og:image:height`などの画像関連タグも、ウェブサイトがプラットフォーム間での共有コンテンツの表示を向上させようとする中で、着実な採用率の増加を見せています。 + +{{ figure_markup( + image="open-graph-usage-by-year.png", + caption="モバイル向けのOpen Graph使用状況(年別)", + description="2022年から2024年までのモバイルページでのOpen Graph使用状況を示す棒グラフ。og:imageの使用率がもっとも高く、og:image:widthとog:image:heightはともに約23.8%と顕著な増加を見せました。og:image:secure_urlも9.41%に増加し、og:image:typeは11.26%に上昇しました。アクセシビリティにとって重要なog:image:altは、2024年に5.78%に成長しました。", + chart_url="https://docs.google.com/spreadsheets/d/e/2PACX-1vTE7UqINKaCzsmdVSUPZhQjlm2Az5T9wcbk4ZMZyJu-Rp8JWXtn9YRfXnAajUqQYLTCnSA2O5FEP6YF/pubchart?oid=513866594&format=interactive", + sheets_gid="560419533", + sql_file="present_types.sql" + ) +}} + +2024年の重要な進展として、Googleが検索ドキュメントを更新し、**`og:title`メタタグ**を検索結果でのタイトルリンク生成のソースとして含めるようになりました。この更新により、GoogleはHTMLの`