GFS репликира парчета, за да се гарантира, че е на разположение на данните, дори и ако не успее хардуер. Тя съхранява копия на различни машини в различни стойки. По този начин, ако един цял багажник се провали, данните би все още съществуват в достъпен формат на друга машина. The GFS използва уникалния идентификатор парче да се провери, че всяка реплика е валиден. Ако една от дръжките на реплика на не съответстват на дръжката парче, главния сървър създава нова реплика и го възлага на един chunkserver.
главния сървър също така наблюдава клъстера като цяло и периодично ребалансира натовареността от преместване парчета от един chunkserver към друг. Всички chunkservers движи с близо капацитет, но никога с пълен капацитет. Главният сървър също така наблюдава парчета и се увери, че всяка реплика е актуална. Ако една реплика не съвпада с идентификационния номер на парчето си, главния сървър обозначава като остаряла реплика. Застоялият реплика става боклук. След три дни, главния сървър можете да изтривате парче боклук. Това е мярка за безопасност - потребителите могат да проверят на парче боклук, преди да бъде изтрита за постоянно и да се предотврати нежелан заличавания
<р> За да предотвратите повреда на данните, на СДФ използва система, наречена checksumming.. Системата се разпада всеки 64 MB парче на блокове на 64 килобайта (КБ). Всеки блок в рамките на парче има своя 32-битова контролна сума, която е нещо като пръстов отпечатък. Главният сървър следи парчета, като погледнете в проверка по сума. Ако контролната сума на реплика не съответства на шах в памет на господаря сървъра, на главния сървър изтрива реплика и създава нов, за да го замени.
<Р> Какъв хардуер се използва Google в своята GFS? Разберете в следващия раздел.
Google File System Hardware
<р> Google казва малко за хардуера в момента тя се използва за работата на СДФ, различни от това е колекция от радио-и телевизионни шелф, евтини Linux сървъри. Но в официален доклад GFS, Google разкри спецификациите на оборудването, което се използва, за да работят с някои от сравнителния анализ и изпитванията върху действието GFS. Докато оборудването за изпитване не може да се превърне в истинско представителство на текущата GFS хардуера, тя ви дава идея за сортиране на компютри Google използва, за да се справят с огромното количество го съхранява данни и манипулира.
<Р> оборудване за изпитване, включени един главен сървър, дв