<Р> Но това е само едно изречение! Можете да си представите, че ако програмата за компресиране работил през останалата част от речта на Кенеди, че ще намерите тези думи и други повтарящи се много повече пъти. И, както ще видим в следващия раздел, ще бъде също пренаписване речника, за да получите най-ефективната организация възможно.
Търсене Patterns
В предишния пример, ние качват през цялото повторени думи и пуснати тези в речника. За нас, това е най-лесния начин да се напише речника. Но една програма за компресиране го вижда по съвсем различен начин: Това няма никакво понятие за отделни думи - тя изглежда само за модели. И за да се намали размера на файла, доколкото е възможно, тя внимателно подбира която модели, за да включи в речника.
<Р> Ако подхождаме фразата от тази гледна точка, ние в крайна сметка с една напълно различна речника. <Бразилски>
Ако програмата за компресиране сканирани израза Кенеди, първото уволнение би попаднете ще бъде само няколко букви. В " попитам не това, което си, " има повтаря модела на буквата " т " последван от разстояние - в " не " и ". " какво; Ако програмата за компресиране е написал това в речника, тя може да напише " 1 " всеки път, когато " т " бяха последвани от интервал. Но в този кратък израз, този модел не се случва достатъчно, за да го направи по-полезно за влизане, така че програмата в крайна сметка ще го презапишете
<р> Следващото нещо, програмата може да забележите, е ". ОУ, " който се появява и в двете " " си; и ". " страна; Ако това беше по-дълъг документ, писане този модел към речника може да спести много място - " ОУ " е доста често срещана комбинация на английски език. Но тъй като програмата за компресиране работил през това изречение, тя бързо ще откриете по-добър избор за речникова статия: Не само, че " ОУ " повтори, но цялото думите " " си; и " " страна; и двете са повтаря, и те са всъщност повтаря заедно, както фразата " " вашата страна.; В този случай, програмата ще презапише речника вписването за " ОУ " с влизането на ". " вашата страна;
<р> Фразата " може да направи за " също се повтаря, едно време, последвано от " " си; и един път, по