Извличане на знание
/ Knowledge Discovery >> Извличане на знание >> тек >> компютър >> компютърен софтуер >>

Как File Compression Works

следвано от " вие, " давайки ни повтаря модела на " може да направи за вас ".; Това ни позволява да напишете 15 знака (включително интервали), с един номер стойност, а " " вашата страна; само ни позволява да напишете 13 знака (с интервалите) с един номер стойност, така че програмата ще презапише " вашата страна " влизане, просто " г страна, " и след това да напишете отделен вход за " може да направи за вас ".; Програмата продължава по този начин, бране на всички повтарящи се битове информация и след това се изчислява която модели тя трябва да напишете в речника. Тази способност да се пренапише речникът е " адаптивна " част от LZ адаптивен алгоритъм речника основа. Начинът, по програма всъщност прави това е доста сложна, както можете да видите от дискусиите по Data-Compression.com.
<Р> Без значение какъв е специфичен метод, който използвате, това по-задълбочено системата за търсене ви позволява да компресирате файла много по-ефективно, отколкото бихте могли само с бране на думи. Използване на моделите ние качват по-горе, и добавяне на " __ " за пространства, ние излезе с този голям речник:
<ол> <ли> ask__
<Ли> what__
<Ли> можете
<Ли> r__country
<Ли> __ can__do__for__you <Бразилски>

И тази малка присъда: " 1not__2345 __ - __ 12354 "
<р> Присъдата сега заема 18 единици от паметта, и нашия речник заема 41 единици. Така че ние сме сгъстен общият размер на файла от 79 единици до 59 единици! Това е само един от начините за компресиране на фразата, а не непременно най-ефикасният един. (Виж, ако можете да намерите по-добър начин!)
<Р> Така че колко добър е тази система? Съотношението на файл за намаляване зависи от редица фактори, включително типа на файла, размера на файла и схема за компресия.

В повечето езици по света, някои букви и думи често се появяват заедно в един и същи модел. Поради този висок процент на съкращение, текстови файлове, компресиране много добре. Намаляването на 50% или повече, е типична за хубава текстов файл. Повечето програмни езици също са много излишни, защото те използват относително малка колекция от команди, които често вървят заедно в комплект модел. Файловете, които включват много уникална информация, като например графики или MP3 файлове, не могат да бъдат компресирани много с тази система, защото те не се повтаря много модели (повече за това в следващия раздел).

Page [1] [2] [3] [4] [5] [6]