След рекордните компания създава своята база данни, той е готов да помогне за идентифициране на песни на потенциални клиенти или да проследят случаи на нарушаване на авторските права. И в двата случая, софтуерът анализира неизвестни аудио клипове по същия начин го е направил за песните в каталога на компанията. Той създава хеш или кратък код, който е зависим от съдържанието на аудио файла. Софтуерът възлага дигитални отпечатъци на клиповете, които след това се сравнява с пръстовите отпечатъци в базата данни. След това, ние ще разгледаме най-точно как да го определя дали песните са едни и същи.
Чу ли? Чу ли?
За да се гарантира, че софтуер за разпознаване на съдържанието идентифицира песни без значение какъв формат те са в, програмисти се концентрират само върху анализиращи звуци, които са в рамките на човешкото обхвата на слуха, точно като MP3 файлове. Една от причините за MP3 файловете са относително малки, е, че само звуците в човешкия слух са кодирани - всичко останало се игнорира. Софтуер Content-признаване не разчита на пълната гама от звуци, които могат да се съдържат в оригиналния запис, защото може след това пренебрегват MP3 версии на аудио запис.
Идентифициране на Sound
Често, звукови клипове са анализирани не са чисти копия на песни. Парчето може да бъде скъсен, или може да бъде подобна на друга песен. Това е мястото, където алгоритми дойде по-удобно. Работата на алгоритъма е да сравни отпечатъците и определи дали входящия звуков клип съвпада песен (или част от песен) в базата данни в определен диапазон на вероятност.
<Р> Процесът на определяне е подобен на начина, по който криминалистите експерти веднъж съвпадащи отпечатъци на заподозрения за тези, намерени на местопрестъплението. Преди сложна компютърен софтуер и съвременни методи за изследване на отпечатъци от пръсти станаха достъпни, експертите ще търсят точки на сходство между различни пръстови отпечатъци. В повечето случаи, специалистът ще трябва да демонстрират най-малко 16 точки на сходство за печат, за да се счита за един мач.
<Р> Няма стандартна гама вероятност за софтуер за разпознаване на съдържанието. Повечето програми дават възможност на клиентите да регулирате нивото на сходство изисква да декларират мач. Например,