Извличане на знание
/ Knowledge Discovery >> Извличане на знание >> пари >> икономика >> благотворителност репутация >>

Как Фондацията Шоа Works

уг - нещо като 75 процента от времето, прекарано индексиране бе пренавиване и превъртане напред лента. Сега свидетелствата се разбиват на едноминутни сегменти.
<Р> Всеки клип е с продължителност на работа код, така че всяка една минута сегмент е представена от определен момент код. Индексиращия отдава индексни му отношение към това време код. Въз основа на това, което е посочено в сегмента една минута, повече от един индекс термин може да се свързва с даден сегмент. Софтуерът за каталогизация е проектирана така, че индексиращия просто избира и влекове подходящи условия от падащото меню в друг прозорец и че свързва автоматично, че дадена ключова дума от времевия код.
, Нуждаещи се от New Hardware

Докато софтуерът зад цифрово видео библиотеката е в крак с времето, на своя хардуер не е толкова авангардни. Понастоящем 52,000 свидетелствата се провеждат серия от цифрови ленти с общ капацитет за съхранение на 400-терабайтов. Настройката е повече от осем години и работи много прилича на голяма джубокс. Има една гигантска роботизирана ръка, която намира и извлича конкретна лента от револвиращ бряг на ленти. След роботизираната ръка е възстановен на лентата, тя зарежда избора в една машина, която е локализирана конкретната сегмента на свидетелство изследователят търси. Този процес отнема нещо като 10 до 15 минути - време, главен изпълнителен директор Фондация Шоа Дъг Greenberg би искал да се намали:
Хората са станали толкова свикнали с компютъра търсене. I седнат на компютъра ми и вид в HowStuffWorks в Google и да получа отговор мигновено. И това е, което очакванията на хората са. Ние никога няма да бъде в състояние да го направи незабавно, защото това са големи и сложни елементи от данни, но ние трябва да сме в състояние да произвежда неща по-бързо -. Това е, което ние сме насочени към <р> С подобаващо финансиране ( кликнете тук, за да видите как се прави дарения за фондацията Шоа), Фондацията Шоа може да се интегрира нов хардуер, който ще осигури много по-бърз достъп до архива. Новият хардуер би удобно съхранение на всички видео данни (около 200 терабайта струва) заедно с всички метаданни, каталогизиране и информация индексиране, от една гигантска твърд диск.
<Р> Нещо донякъде подобен на този процес вече се прави по по-малък мащаб: Специфична програми са разработени, които поддържат уеб-базиран интерфейс на разположение чрез Internet2. По това време, студенти, преподаватели и изследователи в Университета на Южна Калифорния, Rice Univer