忍者ブログ
[PR]
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

【2024年11月23日23:23 】 |
可変長符号・・・
ブロックソートの開始位置や連長圧縮の連長表現に可変長符号を用いれば
圧縮率は多少向上すると思うけど・・・

可変長符号はビット単位の操作となるため・・・
可変長符号を挟んだ前後では同じ文字でも
バイト単位で区切った場合に異なる文字となってしまう・・・^^;

ZLIBやGZIPではどのように扱っているのだろうか???
LZ77アルゴリズムとハフマン符号を用いているからビット単位で操作しているはずだし・・・

DEFLATE Compressed Data FormatについてRFC 1951を読んでみる

・・・

各ブロックが独立しているから・・・隣には影響がないのか^^

でもレンジコーダを使うとファイル全体を1ブロックとして扱うから・・・
可変長符号の前後でも同じ文字は同じ文字として扱いたいなぁ~~~
適応型なら頻度表が更新されるから・・・影響は少ないかな???
でも頻繁にずれると・・・偏りが少なくなってしまうのでは???

試してみないと分からないすね・・・^^;
PR
【2006年12月06日23:56 】 | 圧縮 | コメント(0) | トラックバック()
LZMA SDK・・・
LZMAはLZ77系の符号で近年開発された
7z形式のデフォルト圧縮形式である

圧縮には時間がかかるが圧縮率は高く
展開速度も速いらしい・・・

7z形式はオープン・アーキテクチャであり
LZMA SDK(Software Development Kit)はオープンソースとして公開されている

ライセンスはGNU Lesser General Public License (GNU LGPL)
Common Public License (CPL)等が適用される

オープンソースに関してはオープンソースの定義とライセンスを理解する
分かり易く解説されている

嬉しいことにJavaで書かれたソースも公開されている
早速読んでみることに・・・

・・・

理解するには時間がかかりそうです・・・^^;
まとまった時間が欲しいよぉ~~~
【2006年12月03日17:01 】 | 圧縮 | コメント(0) | トラックバック()
LZB符号・・・
LZ77系の符号でLZSS符号の圧縮率を改善する方法である

LZB符号は一致長の符号化にγ符号を・・・
位置の符号化にCBT符号を用いる

LZB符号は1987年にT.C.Bellよって開発された

LZ符号も様々な改良がなされているため・・・
ブロックソートとの圧縮率も比較してみたいな
【2006年11月29日00:34 】 | 圧縮 | コメント(0) | トラックバック()
LZT符号・・・
LZ78系の符号でLZW符号の辞書更新方法を改良したものである

辞書が満杯になった場合どれかを捨てなければならないが・・・
最近使われていない(最長時間未使用:Least Recently Used)
単語を捨て辞書に空き容量を作る(LRUスキーム)

LZT符号はLRUスキームを行うため処理速度は遅くなるが・・・
辞書を効率的に使用し少ないメモリでも高圧縮率が期待できる

LZT符号は1987年にTischerによって開発された
【2006年11月28日23:44 】 | 圧縮 | コメント(0) | トラックバック()
LZBW符号・・・
LZBW符号化・・・
一致長を表すのに次式を用いる

一致長 = 最大一致長 - 第2一致長

LZ符号化は一般的に展開速度が速いけど・・・
LZBWは一致長に差分を用いるから・・・
圧縮率は良くなるが圧縮展開速度が・・・^^;
【2006年11月02日23:40 】 | 圧縮 | コメント(0) | トラックバック()
前ページ| ホーム |次ページ

忍者ブログ [PR]