Извличане на знание
/ Knowledge Discovery >> Извличане на знание >> тек >> компютър >> интернет >> основи на интернет >>

Как система File Google Works

роблем е скалируемост, който се отнася до лекотата на добавяне капацитета на системата. Една система е мащабируем, ако това е лесно да се увеличи капацитетът на системата. Производителността на системата не трябва да страда като тя расте. Google изисква много голяма мрежа от компютри, за да се справят с всичките си файлове, така мащабируемост е основен проблем.
<Р> Тъй като мрежата е толкова голям, наблюдение и поддържане на това е предизвикателна задача. При разработването на СДФ, програмисти решиха да се автоматизира като голяма част от административните задължения са длъжни да водят системата работи, колкото е възможно. Това е ключов принцип на вегетативната компютри, концепция, в която компютрите са в състояние да диагностицирате проблеми и решаването им в реално време, без необходимост от човешка намеса. Предизвикателството за GFS отбор беше не само да се създаде система за автоматично следене, но и да го проектираме, така че да може да работи с различни огромна мрежа от компютри.
<Р> Ключът към дизайна на отбора, е концепцията за опростяване , Те стигнаха до заключението, че като системи стават все по-сложни, проблеми възникват по-често. Един прост подход е по-лесно да се контролира, дори когато мащаба на системата е огромен.
<Р> Въз основа на тази философия, екипът GFS реши, че потребителите ще имат достъп до основни файлови команди. Те включват команди като отворена, да създават, да четат, пишат и близки файлове. Екипът също така включва няколко специализирани команди: прикрепя и моментна снимка. Те са създали специализирани команди въз основа на нуждите на Google. Append позволява на клиентите да добавите информация към съществуващ файл без да се записва предварително писмени данни. Snapshot е команда, която създава бързо копиране на съдържанието на компютъра.
<Р> Файлове за СДФ са склонни да бъдат много големи, обикновено в диапазона мулти-гигабайт (GB). Достъп и манипулиране на файлове, които голяма ще заемат много от честотната лента на мрежата. Bandwidth е капацитетът на системата да се движат на данни от едно място на друго. На GFS адресите на този проблем чрез счупване файлове нагоре в парчета от 64 мегабайта (MB) всяка. Всеки парче получава уникален 64-битов идентификационен номер, наречен дръжка парче. Докато GFS могат да обработват по-малки файлове, разработчиците не оптимизират системата за тези видове задачи.
<Р> С изискването всички файлови парчета на да бъде със същия размер, за СДФ опростява прилагането на ре

Page [1] [2] [3] [4] [5] [6] [7]