So-net無料ブログ作成
検索選択

ブラウザの表示サイズを確認するbookmarklet [Web]

ターゲットとなるブラウザサイズが決まっている場合などの確認用に。
javascript:(function(){alert("Width:"+innerWidth+"\n"+"Height:"+innerHeight);})()

Google検索キーワードをクオートするBookmarklet [Web]

google検索結果に対してキーワードをダブルクオートで括って再検索します。
面倒なので元々あるダブルクオートとか気にしてません。

javascript:(function(){var s=window.location.search;var begin=s.indexOf("?q=")>=0?s.indexOf("?q="):s.indexOf("&q=");var end=s.substring(begin+1).indexOf("&")>=0?s.substring(begin+1).indexOf("&")+(begin+1):s.length;var q=s.substring(begin+3,end);q=q.split(/\+/).join(" ");q=decodeURI(q);q='"'+q.split(/[  ]+/).join('" "')+'"';q=encodeURI(q);s=s.substring(0,begin+1)+"&q="+q+s.substring(end);location.href=window.location.protocol+'//'+window.location.host+'/'+window.location.pathname+s;})()


あまりテストしてません。

Googleウェブマスターツール認証の「システムに一時的な問題」 [Web]

Googleのクローラやインデックスの状況確認や設定を行うためのGoogleウェブマスターツールがある。(Yahooではサイトエクスプローラーがこれに相当する)

このツールでクローリングの設定を行うためには、まず自分がサイト管理者であるということを証明(認証)しなければならない。
認証方法は、ツールが指定してくるURLに対してアクセス可能にすること。
要求どおりファイルを置けるということは管理者なんだろう、という判断だ。

たとえば、http://www.example.com/ というサイトに関してクローリングの設定を行いたいという場合は、
http://www.example.com/google*************.html
というURLがレスポンスコード200(リクエスト成功)を返すように要求される。
(*************はランダムな半角英数字)

ファイルを設置するなりしてGoogleに読み込ませると認証は完了し、そのサイトに関するクローリング設定やインデックス操作を行うことができるようになる。


ここからが本題。

あるサイトにBASIC認証を掛けたんだけど、すでにGoogleのインデックスに登録されてしまっているのでこれを削除したい。
そんなわけでウェブマスターツールを使うためにrobots.txtやGoogle指定のファイルへのアクセスを許可するためにapacheの設定変更。

SetEnvIf Request_URI "robots\.txt$" nopass
SetEnvIf Request_URI "google****************\.html$" nopass
<Location>
AuthType Basic
AuthName **********
AuthUserFile ***************
Require valid-user
Order allow,deny
Satisfy any
Allow from env=nopass
</Location>


http://xxxxxxxx/google****************.htmlにアクセスできることを確認してGoogleに読み込ませる。
しかし「システムに一時的な問題が発生しました。」と表示されて認証が成功しない。

アクセスログを確認すると、/google****************.htmlへのアクセス(レスポンスコード=200)の他になぜか/noexist_***************.htmlというファイルへのアクセスがあった。
後者はBASIC認証が聞いているのでレスポンスコードは401(未認証)。

Googleグループによると、「指定したURL以外のページのレスポンスコードが404(存在しない)になっていることを確認するため(意訳)」とのこと。
確かにどんなリクエストでもとりあえず200を返しちゃうようなサーバがあったらこんな認証は全く意味がないわけだけど、なんか不親切だなぁ。

というわけで以下の設定を追加することで認証成功。
SetEnvIf Request_URI "noexist_****************\.html$" nopass


タグ:Google SEO

Baiduspider [Web]

サービス開始前から評判が悪い百度(Baidu)。
これまで何件かサーバ移転によるDNS変更に関わったけど、とにかくコイツはDNSを引く気がないらしい。
前のIPアドレス宛にリクエストガンガン投げてくる。

数日もすれば旧サーバのログは百度からのアクセスのみ。
百度のためだけに(新サーバへの)リバースプロキシサーバを立ててる状態ってのもバカバカしいね。

BaiduのUserAgent
Baiduspider+(+http://www.baidu.com/search/spider_jp.html) BaiduImagespider+(+http://help.baidu.jp/system/05.html)

プロトコルを維持した外部リンク [Web]

httpsのページでhttpの画像を貼ると警告ダイアログが出てしまう。
同一ホスト内の画像なら相対パスで指定すれば問題ない。
が、外部ホストの場合はそうはいかない。
全部httpsにすれば?というのもアリかもしれないが、できれば「httpのときはhttpで、httpsのときはhttpsで」いきたいはず。

そんなときはこう指定すればいいらしい。
<img src="//chonaso.blog.so-net.ne.jp/img/file.jpg">


Google Wireless Transcoder [Web]

ここ最近、気になっていた謎のステータス404(File not found)。
大文字が含まれるアクション名に対して、全部小文字されたURIでのアクセスがちょくちょく来ている。
(当然404となる)

別にほとんど害は無いが、コンスタントに来てるのが気持ち悪い。

該当するUser-Agentは以下の通り。
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; Google Wireless Transcoder;)


どうやらGoogleの携帯向け変換エージェントらしい。
でもなぜ全部小文字でアクセスしにくるんだろう…。
しかも大文字小文字正しいアクセスもあるんだよなぁ。
謎は解けず。

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。

×

この広告は1年以上新しい記事の更新がないブログに表示されております。