幸せは加速度センサで測れる

『もう一度いおう。幸せは、加速度センサで測れる。』
そのように言い切った本があります。

過去8年に及ぶ著者自身の加速度センサデータをはじめ、のべ100万人日以上の行動データから、
冒頭の確信に至るまでの経緯が科学的に記された本。
これは凄い。五つ星、いや、星100個くらい付けたい。

■ 人の行動を支配するU分布
この本によると、人の身体運動の頻度は「U分布」と名付けた統計分布に従うのだそうです。
U分布とは何か。それは、統計力学で言うところの「ボルツマン分布」に相当するものです。
U分布は以下の方法で、原理的には簡単に作り出すことができます。

ランダムにマス目を二つ選んで、一方から他方に玉を1個移す。
そして、これを繰り返してみよう。
もともと、ランダムに置いた玉なのだから、そこからランダムにマス目を選んで、
玉を動かしても、結果は変わらない、と思うだろう。
この問題を多くの人に出題してみたが、全員が「結果は変わらない」と答えた。

ところが論より証拠、実際にシミュレーションを行ってみると、玉の分布は「まだら模様」に変化します。
* なぜ過疎と過密ができるのか >> [id:rikunora:20141129]
 ※ 前回のブログ記事は、実はこの本にあった記述を元に作成したものです。
この「まだら模様」こそが、U分布を視覚化したものです。

ここで、Uはユニバーサル、すなわち「普遍的」の頭文字である。

統計的に見た人の行動が、このような単純な原理に従うとは、実に驚きと言う他ありません。

U分布はボルツマン分布を一般化したものだが、おそらく物理を専攻されている人でも、
ボルツマン分布をこのように空間的にビジュアルに見たことは初めてであろう。

はい、初めて見ました。

余談になるが、これは自給自足で生きていた人類が、経済取引をはじめることで、
貧富の差が現れたことの素朴なモデルになっていると思われる。
 我々は、物事には原因があると考えがちだ。
「富める人には、そうでない人とは何か行動に違いがあるはずだ」と結果の背後に原因を追究したくなる。
しかし実際には、多数のやりとりがあると、確たる原因が無くとも特徴的な偏りが生まれる。
     ... (中略) ...
 この「繰り返しの力」を背景にした「資源配分の偏り」こそが、幅広い人間行動や社会現象を説明するのである。
これを理論化したのがU分布である。


■ U分布を捉えることができるか
では、そのU分布を実際に加速度センサから捉えることはできるでしょうか。
一昔前は難しかった加速度データ収集も、今では携帯電話で簡単に行うことができます。
以下のアプリを携帯電話に入れて、私自身の加速度データを収集し、分布を調べてみました。
* シンプル加速度ロガー (Androidアプリ)
>> https://play.google.com/store/apps/details?id=jp.daikiko.Accelogger&hl=ja

携帯電話は胸ポケットに入れておいて、私の通勤前後の1時間の加速度データを収集しました。
データは行きと帰りの2回収集しています。

これは、収集した加速度データをそのままグラフにしたものです。
縦軸が加速度[m/s^2]、横軸は時間で、およそ20ms毎に記録されています。
青、赤、緑は、それぞれX,Y,Zの三軸です。

* 行き:2014/12/05 07:54:20 〜 09:04:25
 213951レコード、4011回のアクション
* 帰り:2014/12/04 17:50:40 〜 19:04:42
 217328レコード、4505回のアクション
   ※ 順序としては、帰りの方を先に計測しています。

他人の目から見れば、ただのゴチャゴチャした線にしか見えないかもしれませんが、
記録と取った本人から見ると、如実に行動が記録されていることが分かります。
ここで小走りに走ったとか、ここで別の部屋に移動したとか、そうしたタイミングが見て取れるわけです。
あまりにも詳しく私の通勤状況がわかってしまうので、詳しい説明は省略します。


この生データ(の絶対値=√(x^2+y^2+z^2))をヒストグラム集計すると、こんな風になりました。

さて、この加速度データから、人間の1回の動き=アクションを読み取りたいのですが、どのようにしたら良いでしょうか?
私は上のヒストグラムから、次のように考えました。
 「ヒストグラムの最頻値を境として、下から上に切り替わったら、1アクションとカウントする。」
生データには、20ms毎に計測した数値がずらっと並んでいます。
そのデータの、下の方は最頻値を境に“あまり加速がかかっていない状態”、
上の方は“加速がかかっている状態”と見なせるわけです。
そして、1回のアクションを
 「加速がかかっていない状態 -> かかっている状態 -> かかっていない状態」
だと解釈すれば、生データの値が境界線を越えた数をカウントすれば良いわけです。
そのように1アクションを定義して、一定時間内にどれ程のアクションが生じたのか、頻度を集計しました。

こうして見ると、分布の様子は確かに指数型になっています。
片対数プロットを見ると、見事な位に一直線上に乗っていることが見て取れるでしょう。
ほんの1時間x2回の測定にもかかわらず、ここまできれいに一直線になるとは思いませんでした。
つまり、U分布は正しかったのです!

■ 幸せは加速度センサで測れるのか?
ところで、表題に掲げた幸せは、加速度センサのどこに表れているのでしょうか?
ここから先はぜひ本を読んで欲しいところですが、
一言で言えば、「幸せはアクションの分布によって定量的に測ることができる」ということなのです。
例えば、熱さ、寒さという感覚については、温度計という客観的な指標ができて初めて
共通の言葉で話すことができるようになりました。

温度という概念を受け入れるためには、見方が逆転する必要があった。
感覚がわかりやすく、温度計が複雑でわかりにくいのではなく、
温度計が客観的でわかりやすいものさしで、感覚の方があいまいで複雑な現象だということに気付く必要があった。

アクションの分布測定は、ちょうど人の幸せを測る温度計の役割を果たす、というのが本の主張です。
このことを確認するには、様々な状況下、幸せなとき、不幸なときにおけるアクションの分布を測ってみる必要があります。
この本の著者は大量の測定データを通じて、U分布は「幸せの温度計」であるとの結論に至りました。
それが本当なのかどうか。
確かめるのは思ったよりも簡単で、自分自身の様々な状況を加速度センサーで測ってみれば良いわけです。
今回、少なくとも私は通勤電車において、自身の分布を確認することができました。
こうしたデータを積み重ねて行けば、加速度センサが「幸せの温度計」となる日は遠からず実現するように思えるのです。

※ 12/08訂正.
※ 以下の記述は、集計方法が間違っており、本で言うところの動作回数ではありませんでした。ごめんなさい_(・・)_
※ 何が間違っていたのかと言うと、生の加速度センサにはバイアスがかかっており、0を中心に振動していなかったのです。
※ このバイアスを是正して数え直したのが上記の結果です。
※ 以下の方法でカウントしたのは、加速度ゼロの線を横切った回数となります。
※ 本で言うところの、一定値以上の運動のカウントとは、数えているものが異なっていました。

この生データ(の絶対値=√(x^2+y^2+z^2))をヒストグラム集計すると、こんな風になりました。

いずれも9.5付近の1カ所に集中していることが分かります。
集中している付近を拡大したのが下のグラフです。

さて、この加速度データから、人間の1回の動き=アクションを読み取りたいのですが、どのようにしたら良いでしょうか?
私は上のヒストグラムから、次のように考えました。
 「ヒストグラムの最頻値を境として、下から上に切り替わったら、1アクションとカウントする。」
生データには、20ms毎に計測した数値がずらっと並んでいます。
そのデータの、およそ半分は最頻値を境に“あまり加速がかかっていない状態”、
残りの半分は“加速がかかっている状態”と見なせるわけです。
そして、1回のアクションを
 「加速がかかっていない状態 -> かかっている状態 -> かかっていない状態」
だと解釈すれば、生データの値が境界線を越えた数をカウントすれば良いわけです。
そのように1アクションを定義して、一定時間内にどれ程のアクションが生じたのか、頻度を集計しました。

縦軸は頻度、横軸は一定時間内のアクション回数です。
一定時間については、生データ30行毎にカウントしたので、20ms×30=約600ms となります。
こうして見ると、確かにアクション回数が高いほど指数的に頻度が下がっているように見えます。
しかし、アクション回数の少ない0〜1回の領域では、逆に回数が少ないほど低頻度です。
つまり0〜1回の頻度は、U分布という理論値よりもずっと低かったのです。
頻度を対数に換算して、片対数にプロットし直すと以下のようになります。

完全な指数分布(U分布)であれば、プロットは1直線上に乗るはずです。
実測値は見ての通り、アクション回数の少ない側で下向きカーブにずれています。
それでも最初の2点、アクション回数=0回と1回を除いた残りは、ほぼ直線と見なせるでしょう。

実際に携帯で測った結果とずれている、ということは、
このU分布の理論(あるいは測定結果)は何か間違っているのでしょうか。

・・・直線に完全には乗らない部分が、人や時期によって、見つかることがある。
つまり直線からの多少の「ずれ」がある場合がある。
     ... (中略) ...
エントロピーは、活動の自由さの尺度だから、この「ずれ」は、自由が制約されている度合いを示していることになる。
 この「ずれ」を詳しく調べることにより、その人が仕事や家庭の場において、どれだけ自由でないか、
束縛されているかどうかが定量化される。

ずれの理由はいろいろと考えられます。
まず、U分布は1日24時間、長期に渡る集計の結果であり、
今回の計測は1時間x2回の通勤時間だけ、という違いがあります。
通勤時間には、あまり動いていない休憩や睡眠の時間は含まれていません。
なので、24時間の集計に比して、低アクションの状態が少ないのは、むしろ当然の結果でしょう。
あるいは、本にあった上の記述を信じるならば、通勤電車という極めて自由の制約された状態が
結果に反映されているのかもしれません。
ともあれ、たったこれだけの実験からでも、
 ・加速度センサから得られるアクションの分布には、何らかの法則性があること、
 ・加速度データは携帯電話を使って簡単に取得できること、
がお分り頂けると思うのです。