「コロナデータのホントの意味を見抜く」には?

2020年9月8日Slow News Report


 今すぐ聴く 



速水:Slow News Report 今日は「日々発表される感染者数の数字に惑わされず、データの本当の意味を見抜くにはどうしたらいいのか」ということで、東洋経済オンラインの荻原和樹さんにお話を伺います。よろしくお願いします。東洋経済オンラインでは新型コロナウイルスの特設ページ内にデータビジュアルを使って日々の感染者数や重症者数などが一目で見て取れるインフォグラフィックスのサイトがあります。荻原さんはここの担当者ということでいいんでしょうか。

荻原:そうですね。私の方で最初にまずどういうデータを入れればいいのかという企画ですとか、実際のデザインや配色をどうするか、あるいはプログラムをどう組むかですとか、下の部分に表示されている Q & Aみたいなものも含めて、だいたい私の方で担当しています。


行政が発表するデータには自動化できないものも多い

速水:なるほどこれ非常に見やすい、分かりやすいと話題になっていますね。荻原さんのツイッターを見ると、データ入力してから今日番組に行きますみたいなことをつぶやいてましたが、実際に自分で数字を見て入力する作業を手作業で行っているんですか。

荻原:かなりの部分は自動化してはいるんですけれども、厚生労働省の発表形式が PDF ファイルだったり、表を画像化したものであったりですとか、7月あたりから一部のデータがオープンデータという機械で判別しやすい形式になったりもしたんですけれども、いろんなデータ形式にわたるんです。ですので、自動化を全部やるのが難しいということがあります。また、毎日の発表を見ていると、昨日はなかった注記がプラスされていたり、基準が変わってしまったりということがあるので、できるだけ自動化しつつも、最後は人の目で確認しています。


データ可視化デザイナーとは

速水:荻原さんは東洋経済の記者なんでしょうか、エンジニアなんでしょうか。

荻原:実は会社の中ではエンジニアとかデザイナーとか記者とか、そういう区分があまりはっきりはしていません。私は編集部の所属にはなっているんですけれども、編集者とか記者というわけではなくて、データをいろんなグラフで表したりですとか、いろんな統計データを見やすく表示したりですとか、そういうデータ可視化されたコンテンツを作るという仕事をメインにやっています。

速水:データ可視化デザイナーという肩書きですが、これはどういったものなんでしょうか。

荻原:政府の統計データですとか、いろんな企業のデータ、スポーツのデータですとか、いろんなデータがあると思うんですけども、やっぱりグラフで表現しにくい複雑なものや量が多すぎるものがあるので、そういうものを3 D やアニメーションにしたり、あるいは今回のように押したら何かが表示されるようなインタラクティブなものにしたりですとか、いろんなことをしてわかりやすく印象的に見せるということをデータ可視化という仕事にしています。

速水:こういうデータインフォグラフィックスをやろうというのは自発的な部分があったんですか。

荻原:そうですね。私はもともとデータ事業局という、会社四季報みたいな企業データを載せた雑誌がありますが、そのデータをメンテナンスする部署にいて、最初はデータベースとかウェブのエンジニアっぽい仕事をしてました。その部署ではいろんなデータを整理して、お客さんに提供するまでが仕事なので、やっぱりそういうデータを自分でも分析して見やすく可視化してみたいという思いを持っていました。そんな時に、こういうデータ可視化というものがある、データジャーナリズムというものがあるというのを聞いて、じゃあそれをやるにはデザインを勉強しなきゃということで、イギリスの大学にいってデジタルデザインを勉強しました。そして戻ってきて今編集部でそういうコンテンツを作っているという経緯です。

速水:なるほど。記者って完全に文系かと思いきや、荻原さんの場合は理系の要素があるわけですね。

荻原:そうですね。大学の頃は社会心理学を専攻していまして、統計のようなこともやっていたので、その辺りのベースになる知識は少しだけありました。

速水:それが新型コロナウイルスにについてどう伝えていくかという中で、こういうインフォグラフィックスを出していこうという企画を出されたんですか。

荻原:2月の中旬頃に、編集長の武政からこういうのをデータ化できないかなという話を受けまして、

速水:さすが武正さん、僕もよく知ってますよ。優秀な編集長ですよね。

荻原:その時はちょうどダイヤモンドプリンセス号のことがあったりですとか、日本の国内でも感染の症例が増えていたということで、かなりいろんな情報が錯綜していました。ですので、ちょっとここで確度の高い厚生労働省のデータを整理して、今どういう状態になっているのか整理しようというコンセプトでこのページを作りました。

速水:今はたくさんのいろんな情報、どれを見たらいいのかわかんなくなっちゃうという状況がずっと続いていると思うんですよね。そんな中で東洋経済オンラインはいくつかの重要な指標を選んで、それをグラフ化したということですよね。それは検査陽性者数、重症者数、 PCR 検査人数、年齢別の陽性者数、これらが主要な指標ですよということで出したわけですね。

荻原:そうですね。このあたりの数字はかなり注目度も高い数字ですね。最初は検査陽性者数と年齢別しかなかったんですけれども、こういうのが欲しいという色んな声を SNS などで拾いながらだんだん増やしていきました。

速水:行政が出している数字を発表しているだけじゃないかと思われるかもしれないですが、そんな話ではなくて、データをどう見るの?とか 何を重視するの?というのはデータを見る専門性が必要とされるということですよね。

荻原:今回の新型コロナウイルスのデータでいうと、例えば我々が普段感染者数と呼んでいる数字、このサイトでは検査陽性者数ですが、そのデータであっても、例えばダイヤモンドプリンセス号の数字は含むのかどうかですとか、あるいは海外から飛行機で日本に来た方が検査を受けて陽性になった数ですとか、そういったものは含んでいないんですね。厚生労働省の発表には含まれているけれども、ここではのぞいている。それはこのページでは国内の感染状況がどうなっているのかに情報を絞りたかったので、そういうものは除いています。どれが正解というわけではないんですけれども、どういうコンセプトでデータを集めたらユーザーに一番有益か、どうしたら一番役に立つかというのを考えてデータの編集を行っています。


新型コロナウィルス感染者が急増したのは検査数が増えたから?

速水:実は多くの人がデータを読み違えていたり数字の意味を理解していないケースがあるということなんですが、例えば6月末から7月にかけて東京で新規感染者数がとても増えました。それはPCR 検査の数が増えたからでしょうと言われていましたが、僕もそんなふうに思っていたことあるんですが、これが実は誤りだということだそうですね。

荻原:少なくとも今出ているデータですと、検査陽性者が増えたのは PCR 検査が増えたからという結論にすることはできないんじゃないかなというのが今の私の見方です。というのも、6月上旬から中旬頃に東京都が PCR 検査の検査人数の公表基準を変えていて、それまでは含めていなかった医療機関における保険適用分の検査も数字に含めるようになったんですね。東京都の数字というのは非常に大きいので、それがかなり全国の数字にも影響を与えるんですけれども、やっぱりその数字がのってしまってかなり検査が増えているように見えてしまっているんです。ただその保険適用分が何件という内訳は公表されていないので、基準が変わる前と後で実際検査が増えているのかどうかというのがちょっと判別しづらいんですね。たまたま同じタイミングで検査要請者数も増えていったので、陽性者が増えたのは検査数が増えたからという、ある意味すごく説得力のあるわかりやすいストーリーがかなり広まってしまったというのがあります。

速水:なるほど。データの数字には背景があって、条件が変わってくるとデータそのものが変わってくる。これ伝えるのって非常に難しいですよね。

荻原:普段我々が普通に見ているデータというのは、例えば一つのグラフがあったらもうずっとその基準は変わらないですし、データが後から修正されるというのもあまり起こらないと思います。でも今回の新型コロナウイルスというのは、普段は一年に一回とか月に1回データを公表しているような行政機関が毎日データを更新していて、その基準も日々変わってしまうということで、データの過去分の修正みたいなものが結構起ってしまっています。そういう中ではちょっと誤解をしてしまう部分があるなというのが私の見方です。それから私の方で誤算だったのは、 SNS なんかでスクリーンショットを撮ってシェアするというのが非常に今回多かったんですけれども、その中で注記が切り取られてしまって画像でシェアそれてしまうということなんです。やっぱり注記って長いし、あまり面白くないものですから、グラフだけ切り取ってシェアしてしまうというようなのがあって、それでますます拡散してしまうというのがありました。

速水:コロナ禍ってもう半年以上続いているわけですけれども、数字を出すことも、多分行政も最初はすごく戸惑ってやっていた部分はあるんだと思うんですが、改善されてきていますか。

荻原:3月、4月あたりは行政機関もかなり混乱していたのかなと思います。頻繁に基準が変わったりですとか、データソースが変わったりですとか、いろんな修正があったりしたんですが、今はかなり落ち着いています。また、我々データをまとめる側も、やっぱり誤解させちゃいけないよなというのがあるので、例えば私の方では、データの注記があったりしたら棒グラフの色を思いっきりガラッと変えてみるとか、注記を読まずにグラフだけを見ても、なんか違うんだなというのは分かるようにというのは今かなり気をつけています。

速水:色を使うことで見え方が違うように工夫するということですが、そもそもどうデザインするかというのも気を使っていますよね。


データを正しく伝えるためのビジュアル

荻原:そうですね。今回のデータは皆さん仕事で見るわけではないので、やっぱり人を惹きつけるような見せ方というのも必要なのかなとは思っています。でもそれはデータを誇張するとか大袈裟に言うというものではないんです。やっぱりデータを見ることって、ほとんどの人にとってはあまり面白くないことだと思うので、例えばここを押したら何かちょっと変わるですとか、そういった仕掛けなりデザインなりで、データを見ることが少しでも楽しくなってくれればいいかなといつも思っています。

速水:これはゲームの影響を受けたりしているところもあるんですか。

荻原:そうですね。私自身結構ゲームが好きで、ちょうどこれを作っている時に「DEATH STRANDING」というゲームをやっていて、そのゲームには SF 的な世界観で壁になにか映し出されたりとか、そういうギミックが色々出てくるんですが、そういうのをイメージしたりしています。


データジャーナリズムへの意識

速水:先程の話ですが、PCR 検査の数が増えたから陽性者が増えたのではないことが後からデータを見てわかるみたいな事って、まさにデータジャーナリズムが注目されていますけれども、そこへの意識って早くからあったんでしょうか。

荻原:データを後から見て、ここの時点で陽性者がピークアウトをしていたとか、そういうデータが残っていれば後からいろんな検証ができるというのはずっと考えていました。ビジュアルとは少し離れるんですが、このサイトはデータとソースコード全部 GitHubというサイトで全部公開をするようにしています。修正履歴からソースコードそのもの、何から何まで見えてしまうので、必要であればいつどんな修正があったか、あるいはコピーを作ることというのも可能なんですけれども、やっぱりデータというのはその場で見るだけではなくて、後から見てここではこういう状態だったねというのが再現できるのも非常に大事かなと思っています。データを残す、後に残すというのはとても大事だと思っていますね。

速水:データジャーナリズムというものを考えた時に、オープンにすることによって誰でも検証可能なものを伝えるということですよね。

荻原:そうですね。実際このサイトに対する SNS の反応にも「東洋経済が信頼できるかどうかは分からないけれども、厚生労働省のデータだから大丈夫だろう」というような意見もあります。我々が厚生労働省からこういう風にデータを取得して、こういう風に加工しましたよというのも、ちゃんとオープンにすることというのが信頼されるジャーナリズムには必要なんじゃないかなと思っています。


数字が表すものを具体的に想像できる力を

速水:最後になりますが、見る側としても受け取る側としてもデータについて学んでいく事って必要だと思うんですが、例えば僕みたいな数字オンチな人たちがこういう時代に生きていくために何かアドバイスをいただいてもいいですか。

荻原:やっぱり数字が何を表しているのかということが想像ができるようになるのがいいんじゃないかなと思っています。例えば検査陽性者数が今7万何人と言われたら、そこにはどういう人が含まれていて、どういう人が含まれないのか。先ほどの空港検疫の件もそうですし、いま自分が PCR検査で陽性になったら含まれるのかどうかというのも含めて、やっぱり数字の中身が何なのか、どういうものを表しているのかということを具体的に想像することというのが大事なんじゃないのかなと思います。

速水:なるほどこれは受け取る側もそうだし、僕へのアドバイスとしても非常になるほどと思いました。最後もう一通メールを読みたいと思います「東洋経済オンラインのサイトは無料でしかも引用フリーとは本当にありがとうございます。ソース RT させていただきます」と頂いています。引用フリーとしているのも面白いところですね。

荻原:やっぱりデータですとかグラフってシェアをしてもらうというのが非常に大事だと思っています。最初にこのサイトを作った時も、いろんな情報が錯綜して、いろんな意見を持っている人がいるからこそ、まずはどんな意見を持っていてもベースになるものというのは必要なんじゃないかなと思って、誰でも使えるようにということで引用フリーにしています。

速水:広く知られること。その中で議論になったり、新しい発見があったりということもあると思います。今日はデータ可視化することの重要さ、データビジュアルの話を東洋経済オンラインの荻原和樹さんに伺いました。ありがとうございました。


新型コロナウイルス 国内感染の状況 - 東洋経済オンライン

https://toyokeizai.net/sp/visual/tko/covid19/">https://toyokeizai.net/sp/visual/tko/covid19/