東京工芸大学　CG解析　第４回　藤木文彦

東京工芸大学　工学部　　電子機械学科／システム電子情報学科　４年　前期

ＣＧ解析　第４、５回

http://fujiki.tv/t-kougei/CG-kaiseki/CG-4.html

目次ページへ　http://fujiki.tv/t-kougei/CG-kaiseki/index.html
２０１３．５．７　　
２０１３．５．１４　
藤木　文彦　

★このテキストは、２週間分です。

　画像・映像の圧縮（可逆圧縮・不可逆圧縮）

　画像・映像をそのままのデータで記録すると、膨大なデータが必要となる。
　例えば、画像1枚を記録する場合を考えよう。

　1枚の画像が　６４０×４８０　ドットからなるとする。
　1ドットがRGB各1バイト、計３バイトであるとすると、そのまま記録すると、
　　６４０×４８０×３　＝　＿＿＿＿＿＿　バイト必要となる。●提出

　現在のカメラのように、　３００万画素、１０００万画素、という数の画素数になると、情報量は、さらに増大し、そのまま記録するのは困難である。

　これを、小さくするために、「圧縮」という技術が用いられる。
　圧縮にはいろいろな方法があり、それぞれの特徴があるが、おおきく、２通りの方法がある。●提出

可逆圧縮：　　　圧縮した画像を、元の画像に完全に戻すことができる。( lossless 圧縮 )
　　　　　　　　　　画像だけでなく、プログラムのように、１バイトでも違うと困るものの圧縮に用いる。
　　　　　　　　　　何度圧縮、解凍（元に戻すこと）を繰り返しても、劣化しない。
　　　　　　　　　　ＺＩＰ，ＬＨＡ、ＬＺＨなど。

不可逆圧縮：　圧縮した画像を、完全には元に戻せない。 ( kissy 圧縮 )
　　　　　　　　　　大体、元通りに見えるように戻ればよいような画像・映像の圧縮に用いられ、画質を落とせば、
　　　　　　　　　　圧縮率を上げることが出来るが、プログラムのように、完全に元に戻す必要があるものには使えない。
　　　　　　　　　　圧縮、解凍を繰り返すと、劣化する。圧縮すれば
　　　　　　　　　　ＪＰＥＧ（写真），ＭＰ３（音楽）、ＭＰＥＧ（映像）など。

　最近のディジタルカメラには、１０００万画素のような物があるが、記録されるデータは、４ＭＢ（４００万バイト）程度となる物が多い。
　この場合実際のデータの、何分の一に圧縮されているか。●提出

　ＭＨ圧縮（ＦＡＸの圧縮法）

　白い画面に、文字や絵が、少しだけ描いてある様な画像の圧縮を、行うときには、ＭＨ圧縮、という方法を用います。
　この方法は、白黒画像の圧縮に用いられ、しろを０、黒を１として表したとき、画像の多くの部分が、連続した０や１のでーたから成り立つような場合の圧縮に適しています。
　例えば、次のような図形を送ります。

図形データ　　　　変換数値データ

００００００００
１１１０００００
１１１０００００
０００１１０００
０００１１０００
００００００００

　上のデータを並べると、次のようになります。
００００００００１１１０００００１１１００００００００１１００００００１１０００００００００００

　このデータを見ると分かるように、０，１が、連続して現れる部分がほとんどです。これを、連続して、０，１の現れる数で、次のように表します。

０×８
１×３
０×５
１×３
０×８
１×２
０×６
１×２
０×１１

　さらに、０，１が、交互に現れることを利用すると、０，１を省略して、

８,３,５,３,８,２,６,２,１１

となります。
　随分小さくなりましたね。

このデータを、上の反対の方法で元に戻してやることで、図形が現れます。

【注意】実際のＭＨ圧縮は、文字のようなデータ（黒い部分が細くて少ない）を圧縮するために、もっと、複雑な変換表を用いてデータを圧縮する。

　この圧縮法は、白黒２色の圧縮となるので、ＦＡＸのような、背景が白いものに書かれた、文字データを送るのに適しているが、写真の様に、一面に各種の色が載っているものの圧縮には、適さない。●提出

　ＪＰＥＧ画像圧縮　

　１枚の画像を圧縮する方法として、ＪＰＥＧという方法がある。
　この方法は、画像を、濃度変化に応じた信号としたときに、その、信号を、「フーリエ変換」という技術を用いて、様々な周波数の基準波形の合成として表す方法であるが、詳しい理論は省略する。

　「フーリエ変換」とは、どのような波形も、正弦波（任意の波形で可）の合成で表せる、という方法である。
　具体的には、白黒の画像の変化のパターンが、どのようなパターンで現れるか、ということを分析して、その変化パターンを一覧として、圧縮する方法である。
　さらに、それを、画像のパターンや、人間の目の特性を利用して、「正確に復元」しなくても、大まかに伝えれば良いことにして、データ量を減らすことができる。

　（１）大抵の画像は、白黒の変化は大まかであり、細かな変化のある場所は少ない。
　（２）人間の目は、細かなパターンの変化に関しては、鈍感である。

ということを利用して、情報量を減らすことができる。

　　近くで見た場合（壁のタイル）　　　　　　　　　　　　　　離れた見た場合

（Ａ）パターンのような大まかな変化の画像のほうが、（Ｂ）パターンのような細かい変化より、出現頻度が高い

　白黒の急激な変化がある映像でも、（Ｂ）パターンと（Ｃ）パターンの違いは、目で見ても解らないから、細かなパターン変化では明るさ変化を大まかにしても、（ごまかしても）見た目には、解らない。

こうした特性を利用して、

ＤＣＴ（離散コサイン変換）という方法で、画像を圧縮することができる。

　フーリエ変換とは　

　画像圧縮の基本技術として、フーリエ変換という技術について解説する。

　音声などの信号は、波で表させる。一番単純な波としては、ｃｏｓ波（正弦波）がある。
　ｃｏｓ波には、各種の振動数のものがある。
　２つのｃｏｓ波を重ねると、合成した波形ができる。
　この合成法を変えることで、いろいろな形の波をつくることができる。
（音楽シンセサイザーの一部には、この方法で人工的に音を合成しているものがある。）
　信じがたい話かも知れないが、以下の図のように、四角い波（方形波）もｃｏｓ波の合成によって、作り出すことができる。また、あらゆる音は、ｃｏｓ波を適切な比率で合成することで表現できる。

　　■ｃｏｓ波合成図面　

　音だけではなく、画像も、縦横の成分を持った波と考えられる。
　たとえば、次のような画像の一部をとりだすと、

　横向きにいくつもの波の合成となっていることが分かります。

　これを、ｃｏｓ波の組み合わせで表します。横４画素からなる画像は、４種類のサイン波の組み合わせで表すことができます。

　画像の濃淡パターンと、周波数の対応を、グラフと絵で示すと下の右図のようになります。
　ｃｏｓ波をうまく組み合わせることで、右図のように、明暗のはっきりした図も描くことができます。どのような波形でも、このｃｏｓ波の組み合わせで表現できます。

　この逆の変換をすることで、どのような波形も、ｃｏｓ波の組み合わせで表すことができます。
　このような変換をフーリエ変換と呼びます。
　フーリエ変換を使うと下図のように、絵や写真を、ｃｏｓ波周波数成分分布表に変換することができます。また、これを逆フーリエ変換することで、元の画像に戻すことができます。

　実際は、無限に多数のｃｏｓ波を組み合わせることはできませんから、８種類のｃｏｓ波を組み合わせることにします。

　実際の映像の変換では、映像を８×８ドットずつに分けます。

ｃｏｓ波の合成に関しては、以下のサイトが参考になります。
http://mars.elcom.nitech.ac.jp/java-cai/signal/furrer5.html

■画像データの圧縮　

（ａ）　　　　　　　　　（ｂ）　　　　　　（ｄ）
原画　→　　フーリエ変換　→　量子化レベル　→　エントロピー　　→　圧縮データ
（ＤＣＴ）　　　変換　　　　　符号化
　　　　　　　　　　　　　　↑
　　　　　　　　　　　　　　　　（ｃ）

画像データの復元
　　　　　　　　　　　　　　　　　　　　　（ｅ）　　　　　　　　（ｆ）
圧縮データ　→　エントロピー　→　逆量子化　→　　逆フーリエ変換　→　復元画像
　　　　　　　　復号化

（ｃ）の量子化とは、濃淡の数値を、圧縮することで、たとえば、
　濃度　１～１０　を　１に、　濃度　１１～２０　を２にする、というような圧縮形式です。元に戻すときには、　１は、１～１０の中央値である、　５　と見なして戻します。
　なお、この段階を大きくすると、画像は荒くなり、細かくすると、画像は精緻になります。

　エントロピー符号化とは、数値データが連続して現れるとき、頻繁に現れるパターンを短い信号に置き換えることで圧縮する方法で、たとえば、０が連続するとか、１が連続するとか、よくあるパターンが、実験的に分かっていますので、その知識に基づいて圧縮します。

（ｄ）のデータを見てもらうと分かりますが、ＤＣＴ変換後のデータは、左上に集中していて、右下側はほとんど０となっていますので、実際の圧縮では、この部分のデータを切り捨てます。
なお、多少１とか、２とかのデータが現れるのを無視することで、圧縮率が高まりますが、その反面、画像は荒くなります。（次ページの画像を参照）

部分拡大（ｄ）　　　　（ｃ）