Googleクロールの文字コード

  • 投稿日:
  • カテゴリ:

Googleサイトマップに登録してみました。

Google からご自身のサイトへのトラフィックや、Google がページをどのようにクロールしているかについて、詳細なレポートを確認できます。

早速レポートを見たのですが、
腑に落ちないのは、EUC-JPで読みに来ていること。
UTF-8で公開しているはず。
同じくUTF-8のココログの方は、きちんとUTF-8でクロールされている。

調べてみるとどうやらサーバーの設定らしい。
Server Header Checkerで調べると、ココログは「Content-Type: text/html; charset=utf-8」となっており、このサイトは「Content-Type: text/html」とある。
これが原因なのだろう。

そこで、.htaccessで
AddType "text/html; charset=utf-8" html
を指定すればいいわけですが、
ここは拡張子がhtmlのままphpでアクセスするための設定をしているので、
上記の指定を入れるとそれが無効になってしまうみたい。

まあ、Googleの検索に引っかかるわけで支障はないのですが...。

リンクソース

  • 記事用リンクソース:
  • Wiki用リンクソース(PukiWiki):
  • Wiki用リンクソース(MediaWiki):
  • SNS投稿用: