[ 先頭 | 上へ | 前へ | 次へ | 目次 | 索引 ]

Readme for analog3.90beta2

Analog の定義

この章では、analog に現れる各項目の定義と、何が各項目で正確に勘定されるかを明らかにします。しばしば少し技術的な話になりますから、もしあなたが簡単にレポートを理解したいときには、最初に Analog のレポート の章を読むことを薦めます。

幾つかの基本的な定義から始めましょう。 ホスト は、ファイルを要求するコンピュータのことです。ファイルは、ページ (即ち、HTML の文書)あるいは画像のようなその他の物です。 全リクエスト は、ページ、グラフィック、等を含む、リクエスト(要求)された全てのファイルを勘定します(ある人々は、これをヒット数と呼びますが、この言葉は他の人々によっては別の意味で使われますので、私はこの言葉を避けました)。ページへのリクエスト は、明らかにページだけを勘定します。リクエストに対する 参照(レファラー) は、ユーザ(あるいは彼のコンピュータ)が今現在見ているファイルが辿ってきた元の場所を意味しています。もしユーザが、現在のページに達するリンクを辿れば、一つ前のページでしょう。ページに現れている画像の場合には、参照は、その画像を含んでいるページでしょう。


analog は、リクエストに関する HTTP の状態(ステータス)コードに基づいて、4種類のリクエストの違いを認識します。ステータス(状態)コードレポートを見れば、各状態コードに対する総リクエスト数、およびそのコードの意味が分かります。(あるいは、詳細は、 HTTP の仕様 を見てください。)

最初に、成功したリクエスト は、200(文書が送られた)と304(この場合、文書が要求されたが、最近修正が無かったため、ユーザがキャッシュされた手元のコピーを用いたからである。)の HTTP の状態コードを持ったリクエストのことである。時には、ログファイルのある行が状態コードを含まない場合がある。これらの行も、analog では、成功したとみなされる。

リダイレクトされたリクエスト は、300番代の他の状態コード (304以外) を持ったリクエストであり、ユーザが要求したのと異なるペー ジを渡されたことを意味している。これらのリクエストが起きる理由の大部分 は、ユーザが誤って後ろのスラッシュ(/)を付けないでディレクトリを指定 した場合である。サーバは、("多分あなたは、以下のことを意味したの でしょうと推測して")リダイレクションで応え、一方ユーザは、2度目の接続を試みて正しい文書を手に入れようとします(しかし通常、ユーザが何かしようとしても、ブラウザは自動的に接続するでしょう)。リダイレクトされた他の主な理由は、"click-thru" と呼ばれる広告のバンナーのためです。

失敗したリクエスト は、400番代のコード(リクエストエラー)を持った文書のためであるか、500番代のコード(サーバエラー)のためである。それらは色々な理由から来ているが、大部分の理由は、要求されたファイルが見つからなかったか、読めないようになっているかのどちらかである。

最後に、情報をもった状態コードを返すリクエスト は、100番代の状態コードを持ったものであり、現在は非常にまれである。

全体の概要に挙げられているログファイルの行には、他に幾つかの種類がある。 状態コードの無い行 は、状態コードが付いていないログファイルの行を指しており、全体の概要中の成功したリクエストは、状態コードの付いた行だけを勘定している。しかし、もしその行がリクエストしたファイル名を含んでおり、そのファイル名が勘定されているならば( LOGFORMAT 中で、米印がついていない場合)、成功に勘定される。 壊れたログファイルの行数 は、analog が文法を理解できない行のことである。そして、除外されたログファイルの項目数 は、我々が明示して 除外した 項目のことである。ホームページへの成功したリクエスト件数は、要求したファイルが与えられ、しかもそのファイルが PAGEINCLUDE コマンドでページと定義された行を参照している場合である。


大部分のレポートは、リクエスト数、ページへのリクエスト数、バイト数、そして最後にアクセスした日を勘定して、成功したリクエストのみを含んでいる。もちろん、レポートがリダイレクションか不成功のレポートでなければの話であるが。時間レポート、状態コードレポート、処理時間レポートそれにファイルサイズレポートには、更に制限がついている。即ち、ログファイルの行は、要求されたファイル名を含み、かつファイル名も勘定されていることが必要である。これは、もしサーバが異なるログ取っている場合に、2重に勘定することを避けるためである。

時間に関係しないレポート の最後に "一覧にされていない" 行は、以下の2つである。 OUTPUTEXCLUDE コマンドを使って、出力からあからさまに除外されている項目と、レポートに出力するには、 フロア が足りないために一覧にされなかった項目である。

全体の概要での括弧内の数字は、最近7日間に対する値である。TO 日時前の7日間か、もし TO 日時が与えられていないときには、プログラムが走る前の7日間である。(ログファイルが使用された最後から7日前であれば、もっと良いのだが、しかしログファイル全体を読むまでそれがいつなのか分からず、それでは遅すぎる。)もしリクエストの全てかどれも7日以内に収まらない場合には、それらの値は表示されない。

ドメインレポートでは、"ドメインが与えられていない" という注意は、ホスト名がドットを含んでいないことを意味する。"未知のドメイン" は、ドットを含んでいるが、ドメイン名が ドメインファイル 中に見つからなかったことを意味する。ホストとそれに関係するドメインは、デバッグ モードをオンにすれば、一覧にされる。


Stephen Turner
analogについての質問はanalog-helpの メーリングリストを読んでください。

[ 先頭 | 上へ | 前へ | 次へ | 目次 | 索引 ]