2018年大学入試センター試験数学1A第2問[2] ①データの分析の用語

この記事では、2018年大学入試センター試験数学1A第2問[2]に関して、データの分析の用語を解説します。





★「青本」2019年数学★「赤本」2019年数学



■ 問題

2018年センター試験数1Aより

第2問

[2] ある陸上大会に出場した選手の身長(単位はcm)と体重(単位はkg)のデータが得られた。男子短距離、男子長距離、女子短距離、女子長距離の四つのグループに分けると、それぞれのグループの選手数は、男子短距離が328人、男子長距離が271人、女子短距離が319人、女子長距離が263人である。

(1) 次ページの図1および図2は、男子短距離、男子長距離、女子短距離、女子長距離の四つのグループにおける、身長のヒストグラムおよび箱ひげ図である。
 次の[サ]、[シ]に当てはまるものを、下の{0}~{6}のうちから一つずつ選べ。ただし、解答の順序は問わない。

 図1および図2から読み取れる内容として正しいものは、[サ]、[シ]である。

{0} 四つのグループのうちで範囲が大きいのは、女子短距離グループである。
{1} 四つのグループのすべてにおいて、四分位範囲は12未満である。
{2} 男子長距離グループのヒストグラムでは、度数最大の階級に中央値が入っている。
{3} 女子長距離グループのヒストグラムでは、度数最大の階級に第1四分位数が入っている。
{4} すべての選手の中で最も身長の高い選手は、男子長距離グループの中にいる。
{5} すべての選手の中で最も身長の低い選手は、女子長距離グループの中にいる。
{6} 男子短距離グループの中央値と男子長距離グループの第3四分位数は、ともに180以上182未満である。

図1,図2

(2) 身長をH,体重をWとし、XをX=(H/100)^2で、ZをZ=W/Xで定義する。次ページの図3は、男子短距離、男子長距離、女子短距離、女子長距離の四つのグループにおけるXとWのデータの散布図である。ただし、原点を通り、傾きが15, 20, 25, 30である四つの直線l1, l2, l3, l4も補助的に描いている。また、次ページの図4の(a), (b), (c), (d)で示すZの四つの箱ひげ図は、男子短距離、男子長距離、女子短距離、女子長距離の四つのグループのいずれかの箱ひげ図に対応している。
 次の[ス],[セ]に当てはまるものを、下の{0}~{5}のうちから一つずつ選べ。ただし、解答の順序は問わない。

 図3および図4から読み取れる内容として正しいものは、[ス],[セ]である。

{0} 四つのグループのすべてにおいて、XとWには負の相関がある。
{1} 四つのクループのうちでZの中央値が一番大きいのは、男子長距離グループである。
{2} 四つのグループのうちでZの範囲が最小なのは、男子長距離グループである。
{3} 四つのグループのうちでZの四分位範囲が最小なのは、男子短距離グループである。
{4} 女子長距離グループのすべてのZの値は25より小さい。
{5} 男子長距離グループのZの箱ひげ図は(c)である。

図3,図4
図3,図4

(3) nを自然数とする。実数値のデータx1, x2, …, xnおよびw1, w2, …, wnに対して、それぞれの平均値を
  _              _
  x=(x1+x2+…+xn)/n,w=(w1+w2+…+wn)/n
                _  __
とおく。等式(x1+x2+…+xn)w=nxwなどに注意すると、偏差の積の和は
     _    _     _    _       _    _
  (x1-x)(w1-w)+(x2-x)(w2-w)+…+(xn-x)(wn-w)
 =x1w1+x2w2+…+xnwn-[ソ]

となることがわかる。[ソ]に当てはまるものを、次の{0}~{3}のうちから一つ選べ。
  __     __       __       __
{0} xw  {1} (xw)^2  {2} nxw  {3} n^2・xw


※分数は(分子)/(分母)、xの2乗はx^2、マーク部分の□は[ ]で表記しています。


■ おすすめ問題集

四分位数、分散など、データの分析の様々な論点が、効率的に整理できると好評です。



2017年の大学入試センター試験数学1A2Bを詳細に解説しました。今回の問題にも活用できる項目があります。



数学の赤本(センター過去問)や、センター試験公式サイトも活用してみると良いかも知れません。


■ 解説

では早速、問題の解説を・・・と言いたいところですが、その前に、この単元の用語について少し解説しておきます。


「中央値」は、中学でも習ったように、データを大きさの順に並べたときに、その順番が真ん中になる値です。データの個数が偶数の場合は、「ちょうど真ん中」が存在しないので、真ん中に近い2つの平均が「中央値」です。

「第1四分位数」は、中央値を境目に、データを上半分と下半分に分けたときの、下半分の中央値です。

「第3四分位数」は、中央値を境目に、データを上半分と下半分に分けたときに、上半分の中央値です。

「第1四分位数」→「中央値」→「第3四分位数」の順番になり、これら3つの値で、もとのデータは四等分されることになります。


「範囲」とは、データの存在する範囲を示します。
「★範囲=最大-最小」で求めることができます。

「四分位範囲」とは、第1四分位数と第3四分位数の「範囲」です。
つまり「★四分位範囲=第3四分位数-第1四分位数」で求めることができます。


そして、「箱ひげ図」は、「箱」の部分が四分位範囲を示し、箱の中央付近に中央値を示す線を引きます。
箱の両側に伸びる「ひげ」を含めて最大値・最小値までの「範囲」を示します。


次の記事→②最初の選択肢

トップページ


【高校数学】読むだけでわかる!センター数学の考え方
http://www.mag2.com/m/0001641004.html

vol.368の記事を分割してお送りしています。
1回にまとめてご覧になりたい方は、該当する回を含む月のバックナンバーをご購入ください。


-----------------------------
 20年以上の実績。全学年、英・数・理をはじめ全教科対応
 かかる費用は授業料と教材費(定価)のみ!生徒募集中です!

プロ家庭教師の江間です。     AE個別学習室
http://www.a-ema.com/k/      http://www.a-ema.com/j/
-----------------------------

この記事へのコメント