pslaboが試したことの記録

はてなダイヤリーからはてなブログに引っ越してきました

この日記は現在実行中の減量記録を含む個人的なメモとして始めましたが、最近はコンピュータやガジェット、ハック、セキュリティネタのほうがメインになっております。

はてなダイヤリー時代はカテゴリ分けが適当だったのですが、これはそのうち直します。


フルブラウザ「Scope」ダウンロード件数に誤り、実際は19万4,323件

http://japan.internet.com/busnews/20050121/5.html の記事から。

この記事の2日前の記事で「世界最小のフルブラウザ「Scope」、i-mode ユーザーの3割以上がダウンロード」というのがあったのですが、このときの数値 1,497万9,954件 は間違いで、正しくは19万4,323件だったという話。

桁が2ケタも違うというのは集計ミスにしてもかなり変なので、ちょっとツッコんでみる。

この集計ミスについて、


ダウンロード件数の集計は、ダウンロードサーバー中にあるカウンタプログラム、および集計を行うネットワーク上のプログラムの連携により行われる。しかし、ネットワークの高負荷にともない、誤ったデータが集計プログラムに送られ、これが誤って集計されたことが直接の原因であると、プログラマーズファクトリでは考えている。

とのことですが、?? という感じ。

1,497万9,954件という数字はかなり膨大な数で、一秒間あたりに換算すると約173回のダウンロードが行われたことになります。これだけの処理を「ダウンロードサーバ中のカウンタプログラム」や「集計を行うネットワーク上のプログラム」の連携によって行っていたならば、かなり性能のよい処理プログラムですね。

私はものぐさなので、こんな処理のためにわざわざカウンタプログラムを作りたくはないから、アクセスログのうちダウンロード処理用のURLに対して発生したものを "grep xxxx access.log | wc -l" のように単純に集計するだけにします。

だからこんな処理のために「カウンタ」や「集計処理を行うプログラム」を組み合わせているのは微妙に不思議な感じがします。

もしかしたら先日に書いた「[Cellular][Application] jig と Scope のどちらが好みかを考えてみた」 で懸念したように、iアプリの個別ダウンロードを識別できる何かを仕込んでいて、Scope を利用する個々人のWebアクセス動向をトレースできるようにしているのではないかと勘ぐってしまいます。「サーバ中のカウンタプログラム」が個別識別用のハッシュ作成で、「集計を行うネットワーク上のプログラム」をハッシュ格納用のデータベースサーバとして考えれば、それなりに筋が通る話です。このようなことを行っているのであれば、方法次第ではダウンロード用の URL が一定せず、アクセスログから集計することが困難となる可能性もあるかもしれません。

それにしても2ケタも間違うのはよくわからん。