相関関係~量的データ|情報I用語-情報通信ネットワークとデータの活用7

二項分布や無停電電源装置など共通テスト対策の情報I用語

「情報通信ネットワークとデータの活用」分野の頻出用語を網羅しました。このページに含まれる単語は以下の通り。

相関関係,属性,第2/第3レベルドメイン,単純集計表,短縮URL,中央値,直線回帰,通信メディア,通信方式,転送効率,度数分布表,動画投稿サイト,同期,二項分布,箱ひげ図,範囲,比率尺度,標準誤差,標準偏差,標本,標本調査,標本分布,分散,分散データベース,平均値,偏回帰係数,偏差値,母集団,母平均,棒グラフ,無線LAN,無停電電源装置,名義尺度,量的データ

情報Iの共通テストや高校の定期テスト対策に、これらの重要語句について分かりやすい詳しい説明を掲載しています。

相関関係
正の相関、負の相関:2つの変数間の関連性
1つの変数が増えるともう1つも増える場合を正の相関、1つが増えるともう1つが減る場合を負の相関といいます。たとえば、勉強時間とテストの点数に正の相関が見られることがあります。
属性
データの特定の性質や項目
データベースのテーブルで列(カラム)として定義される項目です。たとえば、「名前」や「住所」が顧客データの属性に該当します。
第 2/ 第 3 レベルドメイン
トップレベルドメインの前に付く部分
第2レベルドメインは「example.com」の「example」に該当し、第3レベルドメインは「sub.example.com」の「sub」のようにトップレベルのさらに前を指します。
単純集計表
データをそのまま集計した表
データを加工せずに、集計した数や割合を記載した表です。たとえば、クラスの出席人数を学年ごとに集めた表が単純集計表です。これにより、データの基本的な傾向を簡単に把握できます。
短縮 URL
短く変換されたウェブリンク
長いURLを短い形に変換し、シェアしやすくする仕組みです。たとえば、「https://bit.ly/3example」が短縮URLの例です。
中央値
データを小さい順に並べたときの中央の値
データの中心を示す値で、極端な値の影響を受けにくいのが特徴です。たとえば、「10, 20, 30, 40, 50」の中央値は「30」、データが偶数個の場合は中央2つの平均を取ります。
直線回帰
データの傾向を表す直線を求める方法
散布図にプロットされたデータから、その傾向を最もよく表す直線(回帰直線)を導き出す方法です。たとえば、売上と広告費の関係を分析する際に利用されます。直線回帰により、どれくらいの広告費が売上に影響するか予測できます。
通信メディア
データ通信に使用される媒体
通信に使用される物理的または無線の媒体です。たとえば、光ファイバーケーブルや無線LANが通信メディアに含まれます。
通信方式
データを送受信する方法や規則
ネットワークでデータをやり取りする仕組みを指します。たとえば、パケット交換方式や回線交換方式が通信方式に該当します。
転送効率
データ通信で実際に利用される速度の割合
通信回線の理論上の最大速度に対して、実際にデータが転送される効率を指します。たとえば、転送効率が高いほど、通信がスムーズになります。
度数分布表
データを範囲ごとに分類した表
データを一定の範囲ごとに区切り、各範囲のデータ数(度数)を表にしたものです。たとえば、テストの点数を10点刻みで分類し、それぞれの人数を記録するのが度数分布表です。
動画投稿サイト
ユーザーが動画を共有できるプラットフォーム
ユーザーが動画をアップロードして他者と共有できるウェブサービスです。たとえば、YouTubeやニコニコ動画が動画投稿サイトに該当します。
同期
データ通信でタイミングを一致させること
送信側と受信側のデータ転送のタイミングを合わせる仕組みです。たとえば、同期通信ではデータが正しい順序で受信されます。
二項分布
成功と失敗の2つの結果を持つ試行の分布
一定の確率で成功する試行を複数回行った際の成功回数の分布を指します。たとえば、コインを10回投げて表が出る回数が二項分布の一例です。
箱ひげ図
ボックスプロット:データの分布を示す図表
データの最小値、最大値、中央値、四分位数などを視覚的に表す図です。データのばらつきや外れ値を確認するのに役立ちます。たとえば、クラスごとのテスト点数の分布を比較する際に使われます。
範囲
レンジ:データの最大値と最小値の差
データのばらつきを示す簡単な指標です。たとえば、「10, 20, 30, 40, 50」の場合、範囲は「50-10 = 40」です。
比率尺度
絶対的な0を持つデータ尺度
データの比率を計算できる尺度で、0が完全な無を示します。たとえば、体重や売上金額が比率尺度です。
標準誤差
標本平均のばらつきを示す指標
標本平均が母平均からどの程度ばらついているかを示す指標です。標準偏差を標本数の平方根で割って求めます。たとえば、調査ごとに異なる標本平均のばらつきを標準誤差で評価します。
標準偏差
分散の平方根でばらつきを表す指標
分散を平方根にした値で、データの散らばりを元の単位で示します。標準偏差が小さいほどデータが平均値に近いことを意味します。たとえば、分散が「100」の場合、標準偏差は「√100 = 10」です。
標本
母集団から抽出したデータの一部
母集団の中から抽出されたデータで、分析や予測に使用されます。たとえば、日本全国の中学生の身長を調査する際、特定の学校の生徒を標本とすることがあります。
標本調査
母集団の一部を調査する方法
母集団全体ではなく、一部の標本を調査して全体を推定する手法です。これにより、コストや時間を節約できます。たとえば、全国の中学生全員の身長を測定せず、一部の学校を選んで調査するのが標本調査です。
標本分布
標本の統計量の分布
母集団から抽出した標本の統計量(平均や分散など)の分布を指します。たとえば、標本平均を多数の標本から計算すると、それが標本分布を形成します。
分散
データの散らばりの程度を示す指標
データが平均値からどれだけ離れているかを平方の平均で表します。分散が大きいほど、データのばらつきが大きいことを意味します。たとえば、データが「10, 20, 30」で平均が「20」の場合、分散は「100」です。
分散データベース
複数の場所に分散して保存されたデータベース
データを複数のサーバーや場所に分散して保存する仕組みです。これにより、データの可用性や処理能力が向上します。たとえば、クラウド環境で複数の地域に分散して保存されたデータが該当します。
平均値
データの合計をデータ数で割った値
データ全体の代表的な値を示す指標です。たとえば、5人のテスト点数が「80, 90, 70, 85, 95」の場合、平均値は「(80+90+70+85+95)/5 = 84」です。
偏回帰係数
説明変数が目的変数に与える影響の大きさ
重回帰分析で、各説明変数が目的変数に与える影響を数値化したものです。たとえば、広告費が売上に与える影響を偏回帰係数として示します。
偏差値
データの相対的位置を示す指標
集団内での個人の位置を、平均値からの距離で示した値です。偏差値50が平均で、数値が高いほど上位に位置します。たとえば、テストの成績で偏差値60は上位16%に入ることを意味します。
母集団
調査や分析の対象となる全体の集合
研究や分析で対象とするすべてのデータや個体を指します。たとえば、日本全国の中学生全員が母集団となり、その一部を抽出して標本とします。母集団の特性を推定するために標本が用いられます。
母平均
母集団全体の平均値
母集団全体のデータを用いた平均値を指します。標本調査では、標本平均を用いて母平均を推定します。たとえば、日本全国の中学生の平均身長が母平均です。
棒グラフ
データを棒の長さで表すグラフ
カテゴリごとの数値を比較する際に使われる基本的なグラフです。たとえば、各クラスの出席人数を示す際に使用されます。棒の高さや長さでデータの大きさを直感的に理解できます。
無線LAN
Wi-Fi:ケーブルなしで接続するネットワーク技術
電波を使ってデバイス同士を接続する技術です。これにより、スマホやパソコンがインターネットに接続できます。たとえば、自宅やカフェのWi-Fiスポットは無線LANを利用しています。
無停電電源装置
UPSの日本語表記
停電や電力トラブルの際に電力を供給し、データの損失や機器の破損を防ぐ装置です。たとえば、データセンターでよく使用されます。
名義尺度
データをカテゴリーで区分する尺度
カテゴリー間の大小関係や順序がなく、名前や属性で分類するデータです。たとえば、性別や血液型が名義尺度です。
量的データ
数値で表されるデータ
数値や計測値を含むデータで、統計分析が可能です。たとえば、身長、体重、売上金額が量的データに該当します。