Извличане на знание
/ Knowledge Discovery >> Извличане на знание >> тек >> компютър >> компютърен софтуер >>

Как интегриране на данни Works

за данни, която съхранява информация от други бази данни посредством общ формат. Това е толкова специфичен, както можете да получите, когато се описват хранилища на данни. Няма по-единна дефиниция, която диктува какво хранилища на данни са или как дизайнерите трябва да ги вграждат. В резултат на това има няколко различни начина за създаване на хранилища на данни, както и един склад за данни може да изглежда и да се държи много по-различно от друг.
<Р> По принцип запитвания към склада данни отведе много малко време за решаване. Това е, защото склада за данни вече е направил основната работа на извличане, конвертиране и комбиниране на данни. Страна на склада за данни на потребителя се нарича предния край, така че от предния край гледна точка, съхраняване на данни, е ефективен начин да получите интегрирани данни.
<Р> От обратно края на перспектива, това е друга история. Мениджъри базите данни трябва да постави много мисъл в склада за данни система да стане ефективно и ефикасно. Конвертиране на събраните от различни източници в общ формат данните може да бъде особено трудно. Системата изисква последователен подход за описване и кодиране на данните.
<Р> Складът трябва да има достатъчно голяма база данни за съхраняване на данни, събрани от множество източници. Някои хранилища на данни включват допълнителен етап нарича март данни. Склада за данни поема задълженията на събирането на данните, докато Mart на данни в отговор на потребителски заявки от извличане и комбиниране на съответните данни от склада.
<Р> Един проблем с хранилища на данни е, че информацията в тях не е Винаги ток. Това е заради начина, хранилища на данни работят - те тегли информация от други бази данни периодично. Ако данните в тези бази данни промени между екстракции, запитвания към склада за данни няма да доведат до най-актуални и точни виждания. Ако данните в система рядко се променя, това не е голяма работа. За други приложения, все пак, това е проблематично.
<Р> Ако се върнем към нашия пример от преди с доклада за трафика и картата, можете да видите как това би трябвало да е проблем. Докато картата на града може да не изискват чести актуализации, условията на движение може да се променят драстично в относително кратък период от време. A склад за данни може да не извлича данни много често, което означава, време-чувствителна информация не може да бъде надежден. За тези, сортиране на заявленията, е по-добре да се вземе по-различен подход за интеграция на данни.

Page [1] [2] [3] [4] [5] [6] [7]