数Iのデータの分析では統計量の数学的な理解は求められていないような

数Bの統計推測実質必修化の批判のついでに、数Iのデータの分析を批判する言説をみかけた。さすがにこれはどうかと思った。

だいたい、データの分析をいわゆる「演繹的な数学」(といっても大学の数学科数学からすると高校数学は全部数学的でないんだろうけど)として扱う準備がない状況で、データの分析を数学で扱うのはおかしいという意見がある。それに関して思うことを書いておく。燃えないように注意して書いたつもりではあるが・・・

学習指導要領は理論的に統計量を扱えと書いていない

現行の指導要領は次のように書かれている。

四分位偏差,分散及び標準偏差などの意味について理解し,それらを用いてデータの傾向を把握し,活用すること。

パブコメ版の指導要領の、知識・技能の部分にはこう書かれている。

(ア)分散,標準偏差,散布図及び相関係数の意味や扱い方を理解すること。
(イ) コンピュータなどの情報機器を用いるなどして,データを表やグラフに整理したり,分散や標準偏差などの基本的な統計量を求めたりすること。

統計量の定義を正確に書き下せるようにしろとか、手計算で数学的に分散・標準偏差相関係数を理解しろとは一言も書いていない。だいたい、(データの傾向を把握し活用する前提としての)統計量の意味や扱い方を理解するのに、統計量の数学的な理解は絶対に必要というわけではない。ましてや、ベクトルの内積相関係数の関係などを理解することなども必要ない。

せいぜい次のように適当(厳密でないの意味)な定性的な話などをすれば良いだけである。(以下、説明は超適当。主観と余談もかなり入れている。)。

  • 分散・標準偏差は散らばりを表す統計量である。散らばりがないときは0。散らばっていれば散らばっているほど分散や標準偏差は大きくなる。
  • 分散・標準偏差の大小によって、極端なことの起こりやすさの推測ができることがある(この視点がないと、現実の面白い話ができないので。)。
  • 相関係数は1から-1の値を取る統計量である。データがだいたい右上がりの直線状になっていれば1、右下がりの直線状にそうでなければ-1。0の場合はあまり関係ない。
  • 1次関数に類する単調に増加や単調に減少っぽい関数以外では相関係数はあてにならないケースがありえる。とりあえず散布図は必ず描いて眺めとけ。
  • 相関は因果を意味しない。
  • 極端な分布になってなければ、だいたい分散・標準偏差相関係数で何かを判断しても大火傷はしない。
  • 世の中例外も色々あるから必ずヒストグラムや散布図は描けるなら描け(元データが手元にあるならということ)。重要な意思決定をするときには、統計量の大小だけでいい加減には判断するな。
  • 図を複数枚・複数回微妙に条件を変えながら描くのはExcelではだるい。データのからむ意思決定で生活変わる人はRなどの統計ツールを学べ。

K社の教科書は、指導要領の趣旨をかなりふまえた扱いになっていると個人的には思う。上の話も、K社の教科書に書かれていることにかなり影響されて書いている。なお、S社の教科書はその真逆であると思う。センターも、基本的には指導要領の趣旨に合っている出題であると感じている。

この程度の話を1年のときに5時間程度割いてするのに反対するって何なの?と思わないでもない。

変な扱いをする人は確かにいる

問題は、高校の中途半端な授業である。延々と手計算の練習や意味不明のパズルを(これは、前課程の数Bがベクトル・数列と選択になっていた関係で点数調整せざるをえなかった影響を受けている。)させたり、データの傾向と統計量の関係を理解してるか?と称して、(現実のデータ分析とは何も関係ない)暗号解読のような図の解読をさせる問題も定期試験ではみかける。(まあセンターもそうだと言えないこともないが。ただし、現実のセンターはデータはちゃんと面白い物を使っている。)

そういう問題をみると「現実社会で、そんなに細かい関係が必要なら、元データを使ってそれを調べるか、それに適した図に書き換えれば良いだけだよな。まあデータ触らない人はそういう感覚ないから仕方がないか。」という感想を抱く。

しかし、高校側の気持ちもわかる。教科書や問題集にあってインスタントに使える、という現実のデータの分析の例や演習問題があまりになさすぎるというのが現状としてあるのでね。。。

現状も用語知ってますか?程度の扱いですよね

これらを踏まえて、まあ、入試で出して小問1問程度、用語知ってますか?ぐらいの扱いでやれば良いのでは?と思う。そして、それは入試の現状に近いのではないかと思う。

センターは(わりと題材自体は)良い問題を出して、それなりに配点も取っている。しかし、あの問題に対策時間を割いている人もあまりいないと思う。センターの問題は差をつけるために不自然な扱いもあるが、結果として、そんなに差はついていないはずである(数年前の報告書でそう読んだような気する)。ということで、これも小問実質1問扱いのようなものである。何も問題ない。

この程度の用語ぐらいを大学進学者に知ってますか?と聞くのに何の問題があるのだろうか。勉強時間をそんなに割かしているわけでもないし。普通の歴史上の有名人物をちょっと聞いて見ました、程度の話ですよ。こんなもの。

これが数学か?には議論の余地があるが

数Iのデータの指導要領のこの扱いは、演繹的な数学か?と言われると微妙である。「数的リテラシー」とラベリングするのが適切であると思う。では、高校までで終わる人々にこの程度の話を誰も教えなくて良いんですか?特に「大学で教えるから問題ない」と行っている人々。

数IAの持つ政治的性質

数I・数Aというのは、大学進学ルート以外の人に強制できる最後の数学である。よって、ここでどう完結させるのか?という視点からもこの問題は考えられなければならない。これを意識してるのか、数Iは中学4年生的になっている。そうなると、簡単なデータリテラシーは数Iに入れざるをえないと思う。。

だいたい、少しおまけでデータの分析をやるぐらい(進学校で時間数を大量に強制させる枠組みであれば私もまずいと思いますよ)、なんでこんなにまで文句を言われなければならないのだろうか。わからない。

1年の数学はあとで学ぶための基礎的なことを、と理科の人が発言しているのも見た。それをしたいんだったら、大学進学数1と非大学進学数1の2つを作れば良いだけの話である。ただ、その路線は失敗したけどね。2つ前の課程で。数学基礎ってどうなりましたか?

数的リテラシーを誰が教えるの?と言われて数学以外と言える?

高校は大学進学の人だけのためのものではない。そういう人たちに対して、高校で誰が数的リテラシーを教えるのだろうか。単位数とスタッフの揃い方を考えると、数学の時間に数学教師が教えるしかないでしょう。良いか悪いかは別にして。だから文科も数学にねじこんできてるわけでしょ?数学でないと生徒にいろんな意味で強制できないので。情報の教師にそれができるとは思えない。

数学でデータの話を扱うのが嫌なら他に居場所を作る運動をおこしてください

個人的には、データ絡みのあれこれは、情報の教師が情報の時間に全て教えてしまうのが適切だとは思う。情報のIの最初の単元の社会っぽいことを公共に追い出して、情報デザインの単元を中学美術に追い出して、の時間は捻出できる。

そうして、情報をかっちりと理系っぽくしておいて、情報をセンターあたりで入試科目に入れて(そうしないと実効性が担保されないから文科は納得しないので)、情報教員もそれなりにまともなのをそれなりの人数採用させることにすれば数学から統計追い出せますよ?どうですか?

情報で全部データを見るとなると、個人的には気分が良くなる。今回の課程は「データに関して情報と数学で連携を深める」とかお上は言っているが、力関係の差をふまえるとこれは「数学に気を使う」になることが目に見えている。一般的に、他に気を使って何かをやるのは非効率である。それなら、情報で完結して全部自分の好きにやってしまえるほうがスッキリする。

いきなり全員必修の入試科目として情報をいれるのは大変だと思う。よって、まずは理科の選択科目として情報を入れてくれないかな、とか思っている(化学はいやだけど物理と情報で受験ができるなら理系にしたかったという個人の願望でもるが・・・・)。数学科とか情報学科は理科2科目は変だと思いますよ。特に化学。だったら化学の代わりに情報で良いと思うのですが。

あとは経済学部とかの社会科学の学部も国語(古典)の代わりに情報の試験で良いと思うんですけどね。モデル化なんて、社会科学系の学問でやることそのものですから、それをダイレクトに試験するで良いと思うのですが。

色々書いたが燃えないことを祈りたい・・・・