maRkの

キャンペーンだとか、Chess.appについてのなにか

はてスタ疑惑について

賢明なかたには自明な話だったりするのだけど、ユーザーに信用されてないサービスは悲しいものがあるようなので書いてみます。
発端は——とか言うよりは、google:はてなスター スパムで探すとそれっぽい言及されてるサイトの記事がいくつか出てきます。

超要約でいうと、はてなスターを表示してることだけでGoogleにスパムサイト扱いされるかもしれないから、表示しないようにしてる、という話です。

これについては、関心のあるかたもいるようで誰か検証して、みたいなこと書かれているかたもいるんですが、これは検証する術がなかったんですよね。だって、同一の条件でスターがあるサイトと設置してないサイトを用意する必要があるし、重複コンテンツで比較する2つのサイト運用することだけでも、ミイラ取りがミイラ状態になりかねないという。

そんなときに、ウェブマスターツールから新機能が登場しました。Fetch as Google からページのレンダリングができるようになった、ということです。

Google ウェブマスター向け公式ブログ: Fetch as Google でページをレンダリングできるようになりました

細かい機能の説明は省きますが、以下気になる部分だけ拾います。

  • "Googlebot は、すべてのファイルを robots.txt の指示に従って取得"
  • "サイトに表示されるコンテンツやそのレイアウトにあまり影響しない一部のコンテンツ タイプ(ソーシャル メディア ボタン、フォント、ウェブサイト分析スクリプトなど)は、クロールできない状態のままでも構いません。"

とあります。

実際に、このブログ内の記事と、別のはてな外のサイトの記事とをプレビューしてみました。

URL 理由
http://s.hatena.ne.jp/js/HatenaStar.js スクリプト robots.txt により拒否されました

ということのようです。

この部分だけで判断するとすれば、はてなスターはGooglebot からはみられていませんでした。レンダリング時のスクリーンも表示されますが、当然ここに「はてなスター」は表示されていません。

botから見えていない要素について、どうやったらGoogleがスパムと判定するのでしょうか、それは人的なものが介入するより他ないのではないでしょうか。
robots.txtによってブロックされているコンテンツについて、Google側が手動対策されるとはとても思えないです。

プレビューでみてわかったのですが、google.comでもJSファイルに対してブロックしているのがあるということ(公式ブログにはクロールできな状態でもいいよ、と書いてある)。

レンダリング機能ですが、googlebotの認識を確認するのにとても有効なツールだと思います。

ルールに従っておこなってることなのに、思い込みとかだけで不安をあおるようなことして支持者集めるようなことだけは、どうしても容認できません。負の可能性が少しでもあるならやらないほうを選ぶスタンス自体はどうこうはいいませんが。

この件については、自分みたいな馬骨がああだこうだいうよりは、はてな自らが説明して疑惑を晴らして欲しいなとおもいます。