こちらで PATH_INFO の掲示板のことを少し書きましたが、
どうせなら実際にやってみようと思いました。
使用する掲示板
KENT WEBさんの Web Forum v4.3。
特殊な掲示板ではなく、かなり多く使われていると思われる掲示板を選びました。
同サイトの YY-BOARD の方が多く使われているようですが、パラメータの数や掲示板からのリンクが多いことから、
Web Forum を選択。
手順と条件
↑完全にノーマルなタイプと
↑PATH_INFO を使ったタイプを設置。
一応、PATH_INFO を使っているつもりですが、今イチよくわかっていないので、違うかもしれません。
もっとスマートな方法があるのではないかとも思いますが、見た感じは、それっぽく見えるので、まあいいかなと。
どうすべきか迷いましたが、表示上の条件を同じにするため、ログファイルは共通のものを
使うことにしました。
(ロボットに同じページと判断され、どちらかがインデックスされない可能性がありますが)
急いで改造したので、変な部分もあると思いますが、お許しを。
予想
予想としては、PATH_INFOを使った掲示板の方が多くインデックスされるのではないかと思われます。
http://google.bookstudio.com/wforum2/wforum.cgi?no=17&reno=16&oya=16&mode=msgview&page=0
http://google.bookstudio.com/wforum/wforum.cgi/msgview/17/16/16/0/0/
見ていただくとわかりますが、いずれも同じ記事です。
予想では、下はインデックスされ、上はインデックスされないのではないかと思います。
「だからナニ?」と言われると困りますが、当サイトをご覧いただいいている方は、SEOに興味があると思いますし、
掲示板に書かれた内容が検索でヒットしてホームページへのアクセスに繋がるケースもあると思いますので、
チャンスが増えるに越したことはないと思います。
それほど掲示板にこだわることはないかもしれませんが、考えられるメリットは
・掲示板の記事がヒットして掲示板→トップページというアクセスがある。
・インデックスされた各記事からトップページなどへのリンクが発生する。
・とりあえず、掲示板のトップのページランクが上がれば、そこからのリンクはメリットがあるかもしれない。
・仮に自分で何もしなくても、他人が投稿するので、記事(ページ)が増えてラク。
・クローラーのアクセスごとに内容が変わることが多いので、クローラーが訪れる頻度が上がるかもしれない。
的外れかもしれませんが、経験上、なんとなくそう思います。
経過
以下に、Googleのクローラーのアクセスと、インデックスの状況です。
NAVERのクローラーや、自動巡回ソフトによる過剰アクセス(すべてのリンクを一気に辿るため、
wforum.cgi が同時に数十回起動されるような状況でした)により、サーバ負荷が高くなるため、
途中で停止していましたので、現在はインデックスされていません。
日付 |
状況 |
2003/09/03 |
http://google.bookstudio.com/path_info.htm
をアップロード。
|
2003/09/04 |
今、ご覧いただいているこのページをアップロード。
同時に
http://google.bookstudio.com/wforum2/wforum.cgi
http://google.bookstudio.com/wforum/wforum.cgi/
それぞれの掲示板へのリンクを張る。
この時点(深夜)では、いずれのページ(掲示板)にもクローラーのアクセスはなし。
|
2003/09/04 |
早速、トップページ他にクローラー
crawl34.googlebot.com - - [04/Sep/2003:08:00:11 +0900] "GET / HTTP/1.0" 200 15426
crawler10.googlebot.com - - [04/Sep/2003:10:12:56 +0900] "GET / HTTP/1.0" 200 15426
crawler14.googlebot.com - - [04/Sep/2003:10:22:25 +0900] "GET /ranking.html HTTP/1.0" 200 4844
crawler14.googlebot.com - - [04/Sep/2003:10:59:58 +0900] "GET /googlebot.html HTTP/1.0" 200 3610
crawler10.googlebot.com - - [04/Sep/2003:11:00:40 +0900] "GET /index.php HTTP/1.0" 200 7630
PATH_INFO版にアクセス
crawler10.googlebot.com - - [04/Sep/2003:11:01:41 +0900] "GET /wforum/wforum.cgi/ HTTP/1.0" 200 9444
crawler10.googlebot.com - - [04/Sep/2003:11:28:07 +0900] "GET /path_info.htm HTTP/1.0" 200 5382
|
2003/09/05 |
トップページのみ
crawler10.googlebot.com - - [05/Sep/2003:12:30:52 +0900] "GET / HTTP/1.0" 200 15455
crawler11.googlebot.com - - [05/Sep/2003:13:01:22 +0900] "GET / HTTP/1.0" 200 15455
|
2003/09/06 |
PATH_INFO版がインデックスされているのを確認。
http://www.google.co.jp/search?hl=ja&ie=Shift_JIS&c2coff=1&q=http%3A%2F%2Fgoogle.bookstudio.com%2Fwforum%2Fwforum.cgi%2F&lr=
と思ったら、数時間で消える。
PATH_INFO版にアクセス
crawl31.googlebot.com - - [06/Sep/2003:09:39:18 +0900] "GET /wforum/wforum.cgi/ HTTP/1.0" 200 8751
crawler14.googlebot.com - - [06/Sep/2003:13:27:30 +0900] "GET / HTTP/1.0" 200 15457
掲示板の「使い方ページ」にアクセス
crawl31.googlebot.com - - [06/Sep/2003:16:02:48 +0900] "GET /wforum/note.html HTTP/1.0" 200 2632
|
2003/09/07 |
このページとトップページ
crawl31.googlebot.com - - [07/Sep/2003:04:22:51 +0900] "GET /path_info2.htm HTTP/1.0" 200 8495
crawler10.googlebot.com - - [07/Sep/2003:08:34:19 +0900] "GET / HTTP/1.0" 200 15455
crawler11.googlebot.com - - [07/Sep/2003:17:25:35 +0900] "GET /wforum/wforum.cgi/ HTTP/1.0" 200 9180
PATH_INFO版の各記事への巡回開始
crawler12.googlebot.com - - [07/Sep/2003:18:32:33 +0900] "GET /wforum/wforum.cgi/msgview/8/4/1/0/0/ HTTP/1.0" 200 5292
crawler15.googlebot.com - - [07/Sep/2003:18:45:09 +0900] "GET /wforum/wforum.cgi/msgview/4/2/1/0/0/ HTTP/1.0" 200 4819
crawler11.googlebot.com - - [07/Sep/2003:19:41:09 +0900] "GET /wforum/wforum.cgi/msgview/18/17/16/0/0/ HTTP/1.0" 200 4689
crawler15.googlebot.com - - [07/Sep/2003:19:45:44 +0900] "GET /wforum/wforum.cgi/msgview/26/25/24/0/0/ HTTP/1.0" 200 5733
crawler11.googlebot.com - - [07/Sep/2003:19:52:58 +0900] "GET /wforum/note.html HTTP/1.0" 200 2632
crawl34.googlebot.com - - [07/Sep/2003:20:58:27 +0900] "GET /wforum/wforum.cgi/msgview/4/2/1/0/0/ HTTP/1.0" 200 4915
|
2003/09/08 |
昨日と同じリンクへ。
取得バイト数が違うのは、昨日の巡回後、各記事からも「トップページへ」のリンクを付けたため。
crawl31.googlebot.com - - [08/Sep/2003:21:53:06 +0900] "GET /wforum/wforum.cgi/msgview/8/4/1/0/0/ HTTP/1.0" 200 5388
|
2003/09/09 |
PATH_INFO版がインデックスされているのを確認。
http://www.google.co.jp/search?hl=ja&ie=Shift_JIS&c2coff=1&q=http%3A%2F%2Fgoogle.bookstudio.com%2Fwforum%2Fwforum.cgi%2F&lr=
今度は、たぶん大丈夫だと思います。
現時点では、「含むページの検索」も表示される。
http://www.google.co.jp/search?q=%22google.bookstudio.%2Bcom/wforum/wforum.cgi/%22&hl=ja&lr=&ie=UTF-8&inlang=ja&c2coff=1&filter=0
crawl31.googlebot.com - - [09/Sep/2003:06:13:45 +0900] "GET /wforum/wforum.cgi/msgview/18/17/16/0/0/ HTTP/1.0" 200 4689
|
2003/09/10 |
トップページのみ
crawler10.googlebot.com - - [10/Sep/2003:13:29:53 +0900] "GET / HTTP/1.0" 200 15458
|
2003/09/11 |
動きなし
|
2003/09/12
|
2003/09/14
|
トップページのみ
|
2003/09/15 |
トップページとPATH_INFO版
crawler10.googlebot.com - - [15/Sep/2003:12:53:57 +0900] "GET /wforum/wforum.cgi/ HTTP/1.0" 200 9081
|
2003/09/16 2003/09/17 |
トップページのみ
|
2003/09/18 |
トップページ他とPATH_INFO版
crawler10.googlebot.com - - [18/Sep/2003:19:41:43 +0900] "GET /wforum/wforum.cgi/ HTTP/1.0" 200 9277
|
2003/09/19
|
2003/09/27
|
トップページのみ
|
2003/09/28 |
トップページ他とPATH_INFO版
crawler10.googlebot.com - - [28/Sep/2003:12:37:33 +0900] "GET /wforum/wforum.cgi/ HTTP/1.0" 200 9244
|
|