理系学生日記

おまえはいつまで学生気分なのか

Canonical Link

Canonical Linkを正確な理解をしていなかったので調べてみた。以下のようなヤツです。

<link rel="canonical" href="https://kiririmode.hatenablog.jp/entry/20210124/1611500399">

仕様

Canonical Linkの仕様はRFC6596で語られています。

The canonical link relation specifies the preferred IRI from resources with duplicative content

RFC 6596 - The Canonical Link Relation

要するに、重複するコンテンツがあるならば、より適切なリンクを指定することがcanonicalリンクの目的でしょう。

Once specified, applications such as search engines can focus processing on the canonical, and references to the context (referring) IRI can be updated to reference the target (canonical) IRI.

さらにcanonicalが指定されると、検索エンジンは主として指定された側のリンクを処理できるということが記述されています。 また、もう少し詳細な事項が「3. The Canonical Link Relation」に語られており、例えばサイトのAuthorは以下のようなことを想定しておかねばなりません。

  • canonicalとして指定したリンクの方がインデックス化され、重複コンテンツの側はインデックス化されないこと

面白かったのは以下の記述です。自己参照は可能なのですね。

o Be self-referential (context IRI identical to target IRI).

Googleのガイド

Google検索セントラルにおける上級者向けSEOの中で、canonicalについて記述があります。

  • コンテンツが重複あるいは類似している場合、そのうちの1つのURLのみ「正規版」としてクロールされ、他のクロールの頻度は減る
  • コンテンツと品質を評価するための主なソースには正規ページが使用される。検索結果としても正規ページが表示される
    • 重複ページの方がユーザーに適している場合は異なるとの記述あり

気にしていること

例えば本エントリのcanonicalリンクを以下のように誤ってBlogトップページに向けた場合、SEO的にはマイナスになるのか。

<link rel="canonical" href="https://kiririmode.hatenablog.jp"