eye.jpg

アクセスログは見ておくべき。

  • digital

昔のサイトの資産が欲しい

前のというのもおかしいけれど、MT5.2を導入するにあたって前のMT3.31系で構築していたサイトをバッサリ捨て去った


どうだってよい内容だったりヘイトスピーチばっかりで、若い時分は良かったけれど年とって読み返すのも辛いわ。若気の至りでしばらくそのままにしておいたけど、社内浮気男のストーキングもいい加減うんざりなのでがっちり捨ててみた。

けれども過去に投稿したコンタクトの話がことのほかアクセスを稼いでいるようで、まるごと404にしてしまうのももったいない気がする。他にもパジェロのホーンだとかNC700の泥よけとかね。しょっぱいけれどナレッジベース的な扱いになってるのであればそれはありがたい。


.htaccessを活用する

リダイレクト含めたサイトへのアクセスコントロールは.htaccessを使うのがベターのようなので早速使ってみる。今までスパムIPのブロックにしか使ってなかったけど、色々できるというのが前回のテーマ導入時も含めてよく分かった。

とはいえ.htaccessでコントロールするまえに、どのページにどれくらいアクセスがあるかを調べなければならないわけで、じゃあどうするかというとログを片っ端から見ていくしかない。でも行数多いよ。うちみたいなヘボblogでも軽く10000行いくから。


秀丸様万々歳

そこで出てくるのがテキストエディタ。Emacsでもviでもなんでもいいんだけれど、秀丸は4000円!が合言葉の秀丸を私は使っている。とりあえず性器正規表現ができればOK。

^.*検索クエリワード.*\n

検索クエリワードに「消したい行に入っている文字」を入れれば簡単に行が消える。「Googlebot」とか「crawler」とか入れればその行が消えるわけだね。ビバ正規表現。

自分でいらないと思われる行を片っ端から消して行けば、100行にも満たないログに化けるので、アクセスコントロールしたいページを.htaccessに入れれば良いのではないかと。個人でやってるからこれでいいけどね、大企業とかだと大変な作業だよなこりゃ。これ見てSEO対策とかもしてんだろうし。

ていうか過去にネタで書いたシワシワBBAのAVのエントリ毎日探しに来てる人誰なの?

Track Back

Track Back URL

コメントする

※ コメントは認証されるまで公開されません。ご了承くださいませ。

公開されません


画像の中に見える文字を入力してください。

このページの上部へ

サイト内検索

最近のピクチャ