ブロックソートの開始位置や連長圧縮の連長表現に可変長符号を用いれば
圧縮率は多少向上すると思うけど・・・ 可変長符号はビット単位の操作となるため・・・ 可変長符号を挟んだ前後では同じ文字でも バイト単位で区切った場合に異なる文字となってしまう・・・^^; ZLIBやGZIPではどのように扱っているのだろうか??? LZ77アルゴリズムとハフマン符号を用いているからビット単位で操作しているはずだし・・・ DEFLATE Compressed Data FormatについてRFC 1951を読んでみる ・・・ 各ブロックが独立しているから・・・隣には影響がないのか^^ でもレンジコーダを使うとファイル全体を1ブロックとして扱うから・・・ 可変長符号の前後でも同じ文字は同じ文字として扱いたいなぁ~~~ 適応型なら頻度表が更新されるから・・・影響は少ないかな??? でも頻繁にずれると・・・偏りが少なくなってしまうのでは??? 試してみないと分からないすね・・・^^; PR |
![]() |
![]() |
![]() |
|
![]() |
トラックバックURL |
![]() |
忍者ブログ [PR] |