インターネットは一強多弱

・ECショップにおける商品ごとの売上状況、ブログのアクセス数、動画再生数などを調べると、
 インターネットが本質的に一強多弱の世界であることが窺い知れる。
・教訓:ほんの一握りの成功事例を、全体像であると勘違いしないこと。


■ 事例1: 大手ECショップ
インターネット上のECショップって、どの程度売れているのだろう?
ふとした興味から、調べてみました。
とは言え、売上状況を全面的に公開しているECショップは、ほとんどありません。
そんな中、個々の商品の価格と販売数を公開しているECショップがありました。
「公開している」ということと、以下のデータから、どこのショップか察しがつきそうですが、
ここでは匿名の大手ECショップということで話を進めます。

○ 大手ECショップ
・ソフトウェア、電子書籍等のコンテンツ販売(おそらく該当業界の最大手)
・商品点数:約9万点 (調査時点で90851点)
・調査日:2014/03/08


○ 商品ごとの販売数状況
このショップ上で販売数No.1の商品は、約3万件売れていました。(31087件)
販売数の様子をヒストグラムにすると、こうなりました。

このグラフは、横軸に販売数(1区分=1000件)、縦軸に商品点数を描いたものです。
一部のヒット商品が突出している様子がよく分かります。
全商品90851点のうち、83536点は販売数1000件に達していません。
これは全商品の約 92%に相当します。
10位の販売数は 19083件、10位までで全販売数の 0.7% を占めていました。
100位の販売数は 9304件、100までで全販売数の 4% を占めていました。
1件も売れていない商品は、1444点ありました。
1件だけ売れている商品は、1622点ありました。
2件目以降は販売数が単調に減少しているので、少なくとも1件はテスト等で購入しているものと想像できます。


○ 商品ごとの売上状況
では、販売数ではなく、商品ごとの売上金額で見た場合はどうなるか。

売上で見ても、大局的な傾向は変わりません。
上のグラフで、もはや見ることはできませんが、右端に1位があります。
ごく一部のヒット商品が突出し、下位の大多数は売上にほとんど貢献していません。

一般に商品と売上の関係は「ベキ乗則」に従うと言われています。
パレートの法則、80:20の法則、などとも言われています。
上の売上データを両対数プロットすると、こうなりました。

横軸は商品の順位(左側が1位)、縦軸は売上(それぞれ対数)です。
グラフを見ると、中位あたりまではベキ乗則(ほぼ直線)と言っても良いでしょうが、
下位の商品群については、直線からの落ち込みが目立ちます。
全体としては、対数正規分布に従っているようです。

■ 事例2: 中堅ECショップ
上の事例1が想像以上の一極集中ぶりだったので、さらにもう1つ、
データが公開されているECショップを探して集計してみました。

○ 中堅ECショップ
・ソフトウェア、電子書籍等のコンテンツ販売
・商品点数:約2800点
・調査日:2014/03/12

事例1のショップに比べると小規模ですが、一時期はツイッター等でも話題になったショップです。
以下、集計したグラフのみを示します。

○ 商品ごとの販売数状況


○ 商品ごとの売上状況


■ 事例3: Amazon
最も気になるECショップの雄は、やはりAmazonでしょう。
Amazonは売上データを公開してはいませんが、間接的に推測する方法も無くはありません。
その方法によると、Amazonはどうやら「ビッグヒット支配型」だということです。
* Amazonに見る小さなビッグデータ >> [id:rikunora:20130806]

■ 事例4: Topはてな
次はブログの事例。
はてなブログを利用している人であれば、"TopHatenar"というランキングサイトをご存じかと思います。
* TopHatenar >> http://tophatenar.com/
このランキングを見ると、ブログにおいても上位が突出している様子が実感できます。

TopHatenarのグラフは対数表示になっていますが(1, 10, 100, 1000…という桁で目盛りが刻まれている)、
これを普通の目盛りに直すとどうなるでしょうか。

これは、TopHatenarにあったブクマ数を普通の目盛りに直したヒストグラムです。
区分の幅は1000ブクマごと。全体の 98.6%が、1000件に満たない最初の区分に含まれています。
順位とブクマ数を両対数プロットすると、このようになりました。

上のECショップ事例1に比べると、下位の落ち込みは小さくなっていますが、
それでもベキ乗則(直線)よりは、むしろ緩いカーブを描いています。

■ 事例5: ニコニコ動画
動画再生数の傾向は、上のECショップ事例1にそっくりです。
以下の記事をご覧あれ。
* ニコニコ動画再生数は対数正規分布に従う >> [id:rikunora:20140320]

■ 事例6: Androidマーケット
* AndroLib -- Androidマーケットにおけるダウンロード数の分布
>> http://www.androlib.com/appstatsdownloads.aspx

全体の 60.9% がダウンロード数 50未満。
全体の 5.3% がダウンロード数 5万超え。

■ 事例7: 人気投票
2009年当時の過去記事ですが、ラノベの人気投票もベキ分布に近い。
* 人気投票はベキ分布 >> [id:rikunora:20090820]

■ なぜ一極集中するのか?
なぜ、インターネットのアクセス状況は一極集中するのか?
様々な理由が考えられるでしょうが、最も有力なのは、
 「それまでに持っていたリンク数に比例して、新たなリンクを獲得する」
からだと思います。
早い話、人気が人気を呼ぶ、というわけです。
* べき分布のメカニズム >> [id:rikunora:20091130]

こうした一極集中を語る上で、よく引き合いに出される「ベキ乗則」ですが、
個々の事例を調べると、必ずしもベキ乗則に完全一致しているとは言い難いようです。
上の事例の中にも、
 ・両対数プロットを見ると、直線と言うよりむしろ上に凸のカーブに近い.
 ・ベキ分布と言うより、対数正規分布に近い.
といった様子が見られます。
ベキ乗則は第1近似としては正しくても、より詳しく見た場合、必ずしも全てを説明するわけでは無いようです。

■ 上位を全体と思い込まない
例えばECサイトでは、上位のヒット商品は極端に目につきやすく、
中位以降はなかなか目に触れるチャンスが無い、といった事情があります。
口コミにしても、ランキングにしても、大勢を占めるのは結局のところ上位です。
そうした上位フィルターを介して情報を受け取った場合、
「上位=世界の全て」であるという勘違いが生じる危険が付きまといます。
幾つかの成功事例を耳にして、そんなものかと思って自分でもやってみたところ、聞いた話とは全然違っていた・・・
果たしてその成功事例は、全体でどの程度の位置を占めるているのか。
セールストークは向こうからやってきますが、確かめる側の情報は自分から取りに行く必要があります。

■ 近況
※ ここ最近、データやら統計やらの調べ事がやたらと多くなってきました。
※ そのため、なかなかブログ更新もできない状況です。
※ 一部の方には、返事、連絡、コメントが返せなくてすいません。
※ 決して無視しているわけではありません。