情報学概論Ⅰ 第4回

企業情報学部

5/6

情報学概論1  第4回(5/6)

(Introduction to Informatics 1)

1 bit数と空間のサイズ

5桁の2進数

bit 数 = 2進数での桁数 = 表現できる数値の範囲 = 空間の広さ

(前回話したがここにまとめておきます)

  • 片手(5本の指)で、0から31まで(32個の数)が数えられる(実演)。
    • つまり 25 = 32
    • 右図のような(ここでは5桁の)2進数(の、0から始まる最初の5つだけ示した)
  • 両手(10本の指)だと 210 = 1024 であるから、0から1023までの数が数えられることになる(多くの人は小指と薬指が連動して動いてしまうため実際にはこの数え方は実用的ではなく、理論上の思考実験だと考えて下さい)。
210-1

2n の値(概算)

  • (任意の自然数 n について)2n の値(2のべき乗と呼ぶ)の見当がつけられるようにしておくと、情報学を考える際には便利なことが多い。

    • 1,2,4,8,16,32,65,128,256,512,… と、順々に倍々の値を唱えていく、というアプローチも原理的にはある(が、あまりに桁数が大きくなって実用的ではない)。
  • たまたま、210 = 1024 ≒ 1000 = 103 であるという、この近似的な関係を利用する、というのが、情報技術の世界で普通に行われている(微妙な差には目をつぶってごまかす、ということでもあるが、概算の見当だけが必要な場面では問題はないとされている)。
  • 210 ≒ 1000 (1 キロ)、220 ≒ 106 = 100万(1 メガ)、230 ≒ 109 = 10億(1 ギガ)が簡単に思い出せるようにしておくといい(それより上の単位接頭辞は各自調べて下さい)。

接頭辞 230

  • 32 bit で表現できる数値の範囲は、232 = 230 × 22 つまり、10億の4倍、約40億であることがわかる。4ギガとも呼ばれる。
  • なお、この誤差をごまかした部分について、 メビバイト (MB ではなく)MiB などのように表記するやり方も使われている。
メビバイト

空間の広さのインパクト

  • 32bitの空間の広さ(約40億)が情報技術に与えている影響を2つ紹介しておく。
    1. インターネットのIPアドレスと、世界中のコンピュータの数
      • 当初(インターネットの草創期)は想像すらしていなかった事だが、 世界中のコンピュータ類の数が、 232 ≒ 40億台(IPアドレスの、アドレス空間の大きさ)を越えようとしている
    IPアドレス
  1. PCのアドレス空間とメモリーサイズ(容量)
    • 32bitCPU(あるいは32bitOS)では、4GB(正確には 4GiBか;32bitのアドレス空間のサイズ)を超えるメモリにアドレスを付与することができない。つまりそれ以上のメモリは搭載されてもアクセスできない。
    • 実際には32bitのWindowsではしくみ上の制約により3GBが上限になっている。

2 コンピュータが扱うデータ

Case-insensitive
  • 長い間、コンピュータは文字情報しか使えなかった。
    • その文字について、初期のコンピュータでは(概ね、1970年頃にUnixが現れるまで) 大文字しか使えない状態であった。

    • その名残は例えばWindowsの中にも、Case-insensitive な文字体系として散見できる (たとえばファイル名では大文字と小文字が区別されていないなど)。 範囲の拡大 ***

    • 英数字(英語の文字と数字)にいくつかの記号文字(タイプライターの文字集合とほぼ同じ)だけが使える時代もまた長かった(今もプログラミングなどではこの文字集合に制限されることが多い)が、

    • その後、日本語をはじめとした各国の文字も使えるようになり、さらに、

    • マルチメディア化(様々な種類のメディア情報も使える)が進み今に至っている(上図)。

3 CDについて知る

(デジタルデータの一例として)

サンプリングの原理

A/D

デジタルとアナログを(あらためて)考える

データ量の数え方

前々回の宿題の確認
  • 前々回の課題だった、「SDカードにCDが何枚入るか」について、
    • データ圧縮なしを前提にすると右図のように概算できます。
    • データ圧縮については、音源によって圧縮率が異なるため 正確な予測は困難です。

データ量 の正確な計算 と概算

  • CDという技術は、データ圧縮をしない技術。 CDのデータ量計算
    • 当時はコンピュータ技術はまだ成熟しておらずリアルタイムで処理するのが困難だった。
  • なのでサンプリング時のデータ密度(周波数と1chあたりの量子化ビット数)と想定される録音時間から全体のデータ量は簡単に計算できます(右図)。
  • 各自で計算を試みてください。

(以下は次回以降に扱います)

(ここをクリックすると表示が切り替わります)

宿題

1 CDの容量について

CDの容量が(伝統的な74分もので言えば)約600MBであることを、自分で計算して納得してみて下さい。どんな計算をしたか、ご報告ください。

2 アナログとデジタルの違い

アナログとデジタルの違いについて調査し、10行程度の文章にまとめる。参考にした文献やサイト(のURL)も記入すること。時計、テレビ、電話など身近な道具を例にとって(なるべく自分の言葉で)論じるといいだろう。