重複コンテンツによる問題とSEOの影響は?

重複コンテンツによる問題は、先日更新されたGoogle検索エンジン最適化(SEO)スターターガイドには以下のように記載されています。

重複コンテンツは「ペナルティ」になる複数の URL からアクセスできるコンテンツがあっても問題はなく、気にする必要はありません。非効率ですが、手動による対策が必要になることはありません。ただし、他人のコンテンツをコピーすることは、また別の話です。

https://developers.google.com/search/docs/fundamentals/seo-starter-guide?hl=ja

ペナルティとなることはないですが、被リンク評価が分散されたりといったデメリットがあるので注意が必要です。今回は重複コンテンツによる問題や対策方法について解説していきます。

そもそも重複コンテンツとは?

まず重複コンテンツの定義から確認していきましょう。重複コンテンツは、コピーコンテンツと呼ばれることもあり、次に紹介する2つのパターンが考えられますのでそれぞれご紹介していきます。

別のサイトで同じコンテンツが掲載されている

他のサイトで同様のコンテンツが掲載されているときに多いのは、自身が管理している他のサイトの文章を用いてしまうケース。故意に行ったときは当然ですが、サイトの仕様上発生している可能性もあります。

他サイトの文章を用いて記事を作成する場合は「引用」していることを明確にし、元記事のURKなどを記載すると良いでしょう。

サイト内で似たコンテンツが存在する

サイト内部で同じコンテンツが存在してしまうのは、意図的にコピー&ペーストをしている場合だけではありません。ページ数が増えていけば、似ているページが発生し重複コンテンツと見なされてしまう可能性がでてきます。

またタイトルやテキスト文章がワンパターン化してくると、重複コンテンツとなってしまう確率が上がってしまうのです。原因を特定し適切な対応をすることが重複コンテンツの解消にはかかせません。

似たような内容を書いているコンテンツを一つにまとめる事でSEOで有効に働いた事例も多く存在しますので、勇気をもってコンテンツをまとめてみるのもアリかもしれません。

重複コンテンツが良くない理由

重複コンテンツが存在しているとSEO的にもデメリットを被る可能性があるのです。次に具体的にどのようなデメリットが存在するのか解説していきます。

被リンク評価が分散される

被リンクとは、外部サイトに自分のサイトが掲載されることを指します。具体的に言えば自分の作成したコンテンツが、他のブログサイトにおいてリンク参照されている状態ならばそのリンクが被リンクとなるのです。

被リンクはSEOにおいて検索順位を上げるために必要なファクターとして位置づけられています。つまり、この被リンク評価が分散してしまうのは被リンク効果を下げてしまうことにつながるのです。

例えば重複しているページが2つの場合は100受けられる被リンク評価が半分の50:50になってしまいます。被リンク効果を最大限に受けられないために検索結果の上位に表示されないことになるのです。

検索結果に表示されない

Googleの検索クローラーは検索ワードに対して最適な検索結果を表示しようとするので、複数のページをバランス良くインデックスしようとします。可能な限り違う内容のサイトコンテンツを表示することでユーザービリティの向上を目指しているのです。

そのため似ているサイトコンテンツは検索結果の同じページに表示されないようになっています。つまり、コンテンツをいくら量産しても評価されずユーザーにも見てもらえないコンテンツが生まれてしまうことになると言えるでしょう。

ペナルティを受けるケースがある

Googleはユーザーに対して優良なコンテンツを届けられるように運営することを目指しています。そのためのガイドラインを掲げており、それに違反するようなサイトにはペナルティを与えているのです。

無断複製したコンテンツは悪意のある重複コンテンツと判断され、即座にペナルティの対象となる可能性があるので注意しましょう。

■2024年2月追記
Google SEOスターターガイドでは重複しているコンテンツに関しては、非効率ではあるが改めてペナルティを課す事はないとの見解を発表しています。

https://developers.google.com/search/docs/fundamentals/seo-starter-guide?hl=en

重複コンテンツ調べる方法

重複コンテンツを調べる方法は2つあります。ミラーサイト・類似ページ判定ツールを使う方法と、Google検索でフィルタをかける方法です。

ミラーサイト・類似ページ判定ツールを使う

「sujiko.jp」では2つのページの類似度を判定することが可能です。内部の重複コンテンツを調査することもできますし、外部サイトの類似性も確認することができます。

Google検索でフィルタをかける

Googleの検索結果ページのURL末尾に「&filter=0」というパラメータを付与し検索する事で重複ページをチェックすることができます。通常の検索結果では似たようなページや重複ページは表示されないようにフィルタリングされているのです。

この「&filter=0」というパラメータを付与することで、フィルタを解除。つまり、このパラメータを追加したことで自分の保有するサイトコンテンツが表示された場合には重複コンテンツだとみなされているのだと分かります。

重複コンテンツの対策方法

重複コンテンツがあるとデメリットがあるということと、重複コンテンツの見つけ方を紹介しました。続いて重複コンテンツの対策方法について解説していきます。

301リダイレクト処理

301リダイレクト処理とは特定のコンテンツから別のコンテンツへと転送させることを指します。重複しているページをひとつのコンテンツへアクセスさせることで、特定のコンテンツ評価を上げるのです。

301リダイレクトをすると今までの被リンクなどの評価も引き継ぐことが出来るので、コンテンツの評価を下げることになりません。結果として検索順位を保つことになるので、SEOにも効果的です。

Googleが推奨する301リダイレクトの設定は、「.htaccessファイル」に記述をしてリダイレクトをするのが最も主流となっています。ちなみに.htaccessファイルとはWEBサーバー上で利用されるApacheのコントロールを設定するファイルです。301リダイレクト処理以外にも、特定IPアドレスからのアクセス制限やエラーページの設定が可能。ファイルへの記述はFTPソフトを利用して行えます。

サイトをWord Pressで運営している場合は、プライグインを活用すると簡単に301リダイレクト設定が可能です。「Redirection」というプラグインをインストールして利用すればFTPソフトを使わず、ファイルへの記述も必要ありません。

トップレベルドメインの使用

ドメインとはインターネット上のアドレス(住所)であることはご存じだと思います。「example.co.jp」とあった場合これ全体がドメイン名ということになります。

この中にある「.jp」の部分がトップレベルドメインなのです。このトップレベルドメインはさらに2つに分類することができます。ひとつは分野別トップレベルドメインと呼ばれる特定の国や地域によらないトップレベルドメイン。もうひとつが国コードトップレベルドメイン(以下、ccLTD)で特定の国や地域に割り当てられます。

重複コンテンツとGoogleに誤解されないためには、このccLTDを使用しましょう。たとえば、https://www.example.jp を使用すると、https://www.example.com/jp や https://jp.example.com よりも日本を対象としたコンテンツが含まれていることを Google で認識できる可能性が高くなります。

つまり、企業などが英語でサイトを地域ごとのccLTD展開した場合に同じコンテンツ内容であったとしても重複とみなさなくなるということです。

このことから重複コンテンツとして誤解されないために、トップレベルドメインを使用することをGoogleが推奨しています。

内部リンクの一貫性を保つ

内部リンクの一貫性を保つようにしましょう。例を挙げるなら、

  • http://www.example.com/page/
  • http://www.example.com/page
  • http://www.example.com/page/index.htm

この3つの中から、どれか 1 つに絞ってリンクさせるのです。1つに絞ることで特定のコンテンツへの影響力を強めることができます。

使用するドメインをGoogleに伝える

かつてグーグルサーチコンソールには、「使用するドメインの設定」という項目がありました。サイトURLのwwwあり・wwwなしのどちらを正規URLとして優先させるのかをGoogleに伝える機能です。

現在ではこの機能は廃止されてしまい、今後はGoogleが優先ドメインの判断を行います。そのためサイト管理者が優先ページを指定する必要がでてきたのです。

対策方法のひとつとしては、重複するコンテンツに正規URLのリンクを示すhtmlタグである<link>を記載することです。HTMLページで「rel=canonical<link>」タグを使用すれば優先ページであることをGoogleに伝えられます。

またサイトマップを使用したり、301リダイレクト処理を利用したりすることで正規URLをGoogleのクローラーに伝えることができるのです。

空のページを公開しない

空のページはスタブページ、プレースホルダなどとも呼ばれます。これはまだコンテンツが入っていないページのことです。このスタブページ自体がGoogleによって重複コンテンツとみなされています。

したがって、完成していないページを<<制作中>>などとして公開するのはよくありません。何かしらの理由があり、スタブページを公開する場合はインデックスされないように「noindex」タグを使用するようにしましょう。

類似コンテンツをなくす

類似コンテンツが存在すると、重複コンテンツと判断される可能性が高くなります。そのため類似コンテンツが存在する場合は、それぞれのページに内容を追加するかひとつのコンテンツにまとめるようにしましょう。

例えば旅行サイトで1つの都市を別々のコンテンツとして紹介しているが、内容が重複している場合は1つのコンテンツとしてまとめるか、各コンテンツへ内容を追記してそれぞれの別コンテンツとするために独自性を高める必要があります。

システムを理解する

重複コンテンツを出さないためには、システムを理解することが大切。Word Pressなどでブログを運営しているなら、同じコンテンツが複数のフォーマットで表示されることが頻繁にあるのです。

たとえばブログのエントリは、ブログのホームページだけでなく、アーカイブページや同じラベルを持った他のエントリページに表示されることがよくあります。

このような特徴があることを理解して、重複コンテンツを生み出さないような工夫が常に必要なのです。

まとめ

Googleはユーザーの利便性を常に追求しており、重複コンテンツはユーザーにとって無意味なモノと位置づけています。そのため重複コンテンツが存在すると検索結果の順位を下げる、もしくはサイト自体が検索に表示されなくなってしまう可能性があるのです。

重複コンテンツを避けるには、オリジナルコンテンツの作成がかかせません。また重複しないためのサイト設計を事前にしっかりと行う必要があります。

自社での対応が困難であれば、ライティング代行サービスに依頼するのもひとつの手段です。
ライターステーションの記事作成代行は、競合調査、キーワードの提案、記事構成の作成からライティングまで、貴社のニーズに沿ったご提案をさせていただきます。
まずはお気軽にご相談ください。

この記事を書いた人

ライステ編集部:和賀
ライステ編集部:和賀
1,200名以上登録されてるライタープラットフォーム:ライターステーション責任者。2024年より「記事作成代行サービス」や「Hubspot導入支援」、「インタラクティブ動画」など、コンテンツマーケティングに関する支援を開始。

記事作成代行サービス概要資料

記事作成代行サービスに関する概要資料になります。
まずはお気軽にダウンロードしてください。