この記事の目的
今やビジネスにおいてコンピュータ・情報・通信などを中心とする「IT用語」に対する知識は欠かせません。
あまり馴染みがない各分野のIT用語を、なるべく専門用語を使わずに解説していきます。
この記事の対象読者
Web制作を始めたばかりの人。
自社のWebマーケティングを任された人。
専門用語についていろいろ知りたい人。
Webマーケティングを行なっているが、言葉の定義を再確認したい人。
など、Webに限らずDXに携わるすべての方に。
sitemap.xml(XMLサイトマップ)とは
sitemap.xml(XMLサイトマップ)とは、サイト内に存在するURLのリストが記述されたファイルです。
これはユーザー向けの「サイトマップ」とは完全に別物で、サイトの構造を示して検索エンジンのクロール(巡回)を補助するためのものあり、sitemap.xmlを設置することで検索エンジンのインデックス漏れを防ぐことができます。
sitemap.xml(XMLサイトマップ)の役割
検索エンジンは以下の流れでインターネット上のサイト情報を収集しています。
- クローラで「クロール」(巡回、収集)
- クロールで収集した情報をデータベースに「インデックス」(登録)
- インデックスしたWebサイトを「ランキング」(評価)
sitemap.xmlは上記で示したクロールの段階で役割を果たします。
検索エンジンのクローラはネット上のすべてのページを見つけ出して巡回するわけではなく、クローラが巡回しないページも存在します。そこでsitemap.xmlにクロールして欲しいURLをリストアップします。サーバー上にsitemap.xmlが存在すればクローラはそれを参考にサイト内を巡回するため、巡回漏れを防いでくれます。
sitemap.xmlを作成したからといってSEO評価に直接影響を与えることはありませんが、どこからもリンクされていないページや、大規模なサイトの一部のページなどはクローラに見つからない可能性があるので、効率的にクロールしてもらうためにもしっかりとsitemap.xmlを作成することが重要となります。
sitemap.xml(XMLサイトマップ)の書き方
サイトマップの記述ルールは次のとおりです。
- <urlset> タグで始め、</urlset> タグで閉じます。
- <urlset>タグ内にプロトコル標準を指定します。
- 各URLを<url>を親タグとして囲います。
- <url>に<loc>を子要素として含めます。
その他にオプションのタグがありますが、検索エンジンによって対応の有無が変わります。
sitemap.xml(XMLサイトマップ)の記述例
サイトマップは、次のように記述します。
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”https://www.sitemaps.org/schemas/sitemap/0.9/”>
<url>
<loc>https://speever.jp/</loc>
<lastmod>2022-12-23</lastmod>
<changefreq>monthly</changefreq>
<priority>1.0</priority>
</url>
</urlset>
sitemap.xml(XMLサイトマップ)の構成要素
詳しい要素の解説は以下のとおりです。
要素 | 要否 | 説明 |
---|---|---|
urlset | 必須 | プロトコル標準を参照。一つだけ記述します |
url | 必須 | 各URL情報を囲う親タグです。 locやlastmodなどを子要素に含めます。 設定可能なURL数は、50,000URLです。 |
loc | 必須 | サイト内のURLをhttp(s)から始まる絶対URLで記載し末尾はスラッシュで終わらせます。 wwwの有無は統一し、値は2048文字以下にする必要があります。 |
lastmod | オプション | 最終更新日時を記載します。 値はW3C Datetime形式で記述します。 形式:YYYY-MM-DDThh:mm:ssTZD 例:2022-12-23T12:00:00+09:00 時刻は省略してYYYY-MM-DD形式も可。 |
changefreq | オプション | ページの更新頻度を以下の値で記載します。 always:アクセスするたびに更新されるページhourly:毎時更新されるページdaily:毎日更新されるページweekly:毎週更新されるページmonthly:毎月更新されるページyearly:毎年更新されるページnever :アーカイブ ページ 検索エンジンはこの値を参考にしてクロール頻度を調整しますが、必ずその通りになるわけではありません。neverにしたページもクロールは行われます。 |
priority | オプション | ページの優先度を0.0から1.0までの値を記載します。 検索エンジンに重要なページを伝える役割をもちます。 デフォルトは0.5 優先度の値は相対的なものであり、すべてのURLに高い優先度を設定することは望ましくありません。 |
sitemap.xmlを検索エンジンに伝える方法
sitemap.xmlは作成してサーバーに設置した後は検索エンジンに読み取ってもらう必要があります。方法は主に2つありますので紹介していきます。
robots.txtファイル
1つ目はrobots.txtファイルにサイトマップの場所(URL)を記述する方法です。
例:
Sitemap: https://speever.jp/sitemap.xml
robots.txtはサーバー内のルートディレクトリに設置します。すると検索エンジンはクロール時に自動的にrobots.txtを読み込み、sitemap.xmlの情報が伝わります。この方法は検索エンジンのクロールを待つ必要があるので、次にいつサイトマップが検索エンジンに伝わるかがわかりません。
Google Search Console(サーチコンソール)から送信する
Googleに対しては、Google Search Consoleを使用してsitemap.xmlを能動的に送ることができます。
登録手順は以下のとおりです。
- Google Search Consoleにログイン
- 左のサイドバーにある「サイトマップ」をクリック
- 「新しいサイトマップの追加」にsitemap.xmlのURLを入力
- 送信
sitemap.xmlの情報はすぐに適用されますが、すぐにクロールされるわけではないので注意してください。
まとめ
sitemap.xml(XMLサイトマップ)を設置することでクローラがサイトの全貌を把握しやすくなり、インデックス漏れを極力ふせぐことができます。新しく作成したページはsitemap.xmlになるべく記載しておきましょう。