「私のタイムラインでは投票率100%なのに」は本当に100%なのか

今回の参院選の投票率は52.05%だったそうです。
それに対して、Twitterユーザにより「私のタイムラインでは投票率100%なのになぜ」という趣旨の発言がなされ、それを受けて別の誰かが「同類だけが集まったタイムラインの偏りを思い知れ」等と揶揄する、という光景を複数カ所で見ました。

たしかに、タイムラインでの投票率が本当に100%であり、かつ世の中の投票率が52%だったのであれば、それはその人のTwitter上の人間関係と世の中が乖離していると言えます。
しかし実際にはそうではないのではないでしょうか?「私のタイムラインでは投票率100%」という前提の方が間違っているということはありませんか?

その投票率100%、本当に100%ですか?

タイムラインの投票率を調べる

実は、かくいう僕自身も、「我がタイムラインの投票率は100%だな、ガハハ」と思っていました。公示日以降、期日前投票へ行った旨のツイートは毎日のように見かけましたし、投票日には多くのアカウントが投票所に行った感想を投稿していました。
しかし現実的に考えて500人以上いるFollowingの全員が投票に行っているわけがないのも事実。その実数を集計してみることにしました。


まず、筆者のフォロー人数はこれだけです。

筆者のフォロー人数:586人

この586人を、選挙に関するツイートをもとに

  • 投票に行った人
  • 投票に行かなかった人
  • 投票に行ったか不明な人
  • 調査対象外

の4つに振り分けていきます。

データ抽出

Twitter APIを用いてFollowingのリストを取得し、Spreadsheetにまとめました。

このうち、以下のアカウントは調査対象から除外することにしました。

  • 日本での選挙権のないアカウント(外国籍の人など)
  • 企業公式アカウント等で、プライベートに関するツイートを行わないアカウント
  • bot等、人格を持たないアカウント

これらは集計上のノイズとなるため、カウントしないことにします。
調査対象外:89人

次に、ふたたびTwitter APIを叩いて各アカウントの最終ツイート日を調査しました。
すると127件のアカウントが期日前投票が始まった6/23以降にツイートしておらず、投票に行ったかどうか不明であることがわかりました。これらの人は対象外とせず、不明扱いです。
投票に行ったか不明な人:127人

ツイート分析

いよいよ選挙に行った人を調べていきます。ツイート分析といっても自然言語解析の専門家ではないので、大したことはしていません。主に手作業です。

まず、Twitter検索にて「投票 filter:follows」で検索し、投票に行った旨のツイートをしているアカウントを割り出しました。

63件ありました。
選挙に行った人:63人

さて、ここまでで586人中、307アカウントについて調査できました。
問題はここからです。地獄の目視調査が始まります…。

結果、307アカウントの内訳として、以下のようなことがわかりました。

●選挙に行ったと明示
「投票」以外のワードを使って投票した旨が明示されていた(例:「Voted」、「選挙行った」、投票済証の写真、など。)…23人

●明示はされていないが選挙に行っていそう
周囲に投票を呼び掛けるツイートをしている、特定の候補者を応援している旨のツイートをしている、選挙に行く予定である旨のツイートをしている、など…11人

●選挙に行かなかったと明示
「○○をしていて行けなかった」等…2人

●選挙に行ったかどうか不明
行ったとも行っていないとも書かれていない…271人

タイムラインの投票率は…

これらを足していくと、次のようになります。

選挙に行った人:63+23+11=97人
選挙に行かなかった人:2人
投票に行ったか不明な人:127+271=398人

これより投票率を計算すると、投票率は、
19.5%~99.6%のあいだ
ということになります。
上限の99.6%だとするとかなり100%に接近するのは確かですが、とはいえやはり印象に反して、投票率100%ではないのは確実といえます。

もう少し絞り込む

エビデンスをもとに確実に言えることはここまでですが、とはいえちょっと幅広すぎますし、もうちょっと推定して絞り込んでみましょう。
以下、統計の専門知識があるわけではないので、検証の妥当性については保証できないことをご了承ください。

投票状態が不明であった398人について、アクティブなアカウントと休眠状態のアカウントに分けて推定していきます。

アクティブなアカウントの推定

こんなアンケートを取ってみました。

RTでの拡散もされていませんので、自分のクラスタ内の傾向を把握するのにそこそこ純度の高い数値が取れたと思います。

「結果を見る」を除いて集計しなおすと、投票した人のうち43%の人がその旨をツイートしています(執筆時現在)。
今回の集計で「投票した」と書いていた63+23=86人がこの43%に相当すると考えると、投票ツイートをしていない(投票しかたどうか不明だった)アクティブアカウント271人の中にも、97÷43×57=114人、投票に行った人がいることになります。
投票しかたどうか不明だった人のうち、のこりは投票していないと推定します。

休眠状態のアカウントの推定

最終ツイート日で割り出した休眠状態の127人の投票状態は不明ですので、不本意ながら、参院選の投票率52.05%を使って投票に行ったか推定することにします。
そうすると66人が投票したと考えられます。

推定される投票率は…

それらを加味すると…

行ったし、ツイートした人:97人
行ったけどツイートしてない人:114人
不明だが行ったと推定される人:66人
行ってなくてツイートした人:2人
行ってないしツイートしてない:157人
不明だが行っていないと推定:61人

改めて計算すると、実際の僕のタイムラインの投票率は55.7%となりました!
参院選の投票率52.05%より3.65%高いです!実質100%!!政治的関心の高いタイムライン万歳!!!!!(白目)

まとめ

あくまで自分の場合ではありますが、「私のTwitterのタイムラインでは投票率100%」は完全な思い込みであり、実際の投票率とさほど変わらないことがわかりました。
原因としては、選挙に行った人は「行った」と書くけれども、行っていない人はわざわざ「行っていない」と書かないので、行った人だけが印象に残る、というのが大きそうです。

また、これを揶揄する側の発言も、「同類だけが集まったタイムラインの偏りを思い知れ」は不正確であることがわかります。投票率が100%だと思ってしまう原因は、偏った観測範囲による偏った統計結果ではなく、ちゃんと統計を取らず印象だけで判断していることにあるといえるでしょう。タイムラインがエコーチェンバーになってしまっているのではなく、むしろ多様性のあるタイムラインにもかかわらず、先入観によりそれを見失っているということです。
あくまで自分のケースでは、という話ですが。