Извличане на знание
/ Knowledge Discovery >> Извличане на знание >> пари >> икономика >> благотворителност репутация >>

Как Фондацията Шоа Works

индексирани, така че изследователите биха могли бързо да имат достъп до информация от вътрешността на визуална история свидетелство архива. Тук, Фондацията Шоа трябваше да бъде пионер. Индексирането софтуер е съществувала в продължение на текстово-базирани колекции, но не и за тяхното събиране въз основа на видео. Въведете екип от софтуерни инженери, информационни мениджъри, библиотекари, историци и технологични специалисти. Заедно те разработен собствен софтуер Фондацията Шоа, че позволява на своя персонал да правят всичко съхранение, каталогизиране и индексиране на архива да извърши проучване за клиентела
Международни Интервюта <р> Фондация Шоа е провел интервюта в следните 56 страни:. <Бразилски>

Аржентина, Австралия, Австрия, Беларус, Белгия, Боливия, Босна и Херцеговина, Бразилия, България, Канада, Чили, Колумбия, Коста Рика, Хърватска, Чехия, Дания, Еквадор, Естония, Финландия, Франция, Грузия , Германия, Гърция, Унгария, Ирландия, Израел, Италия, Япония, Казахстан, Латвия, Литва, Македония, Мексико, Молдова, Холандия, Нова Зеландия, Норвегия, Перу, Полша, Португалия, Румъния, Русия, Сърбия и Черна гора, Словакия, Словения, Южна Африка, Испания, Швеция, Швейцария, Украйна, Великобритания, САЩ, Уругвай, Узбекистан, Венецуела и Зимбабве каталогизация.
и индексиране
<р> За да каталогизирате специално свидетелство, член на персонала влиза кратко биографична информация за наследствената или свидетел. След това, свидетелството се индексира с помощта на специфични ключови думи, избрани от 30 000 думи на Фондацията на Шоа, контролирано от речника, английски език речник. Също така е създадена в къщата, на речника е развила с течение на времето, както индексатори гледат действителната свидетелство. Тъй като ключовите думи всъщност идват от показанията, тезауруса продължава да се разширява, тъй като повече свидетелство се индексира. Индекс термини са предимно географски имена, като например имена на градове, села и други места, но те не включват преживяване съдържание, както и, като " чувство за време в лагерите ".
<Р> Защото тезауруса е на английски език, всички настоящи индексиране се прави на английски език. Свидетелските показания, дадени на други езици се обработват от двуезични индексатори.
<Р> На първо място, всеки видеоклип показания индексира в три до пет минути сегменти, но е установено, че голяма част от времето, прекарано в тези стъпки индексиране е загубен опитва да реши къде сегмент приключила и започва др