Извличане на знание
/ Knowledge Discovery >> Извличане на знание >> тек >> електроника >> джаджи >>

Как разпознаване на реч Works

ва да съответства на цифровия звук с фонема, че е най-вероятно да дойде следващата. По време на този процес, програмата възлага на полувремето вероятност за всяка фонема, на базата на своя вграден речник и потребителското обучение
<р> Този процес е още по-сложно за изрази и изречения. - Системата трябва да разбера къде всяка дума спира и започва. Класическият пример е фразата " признае реч, " което звучи много прилича на " развалина хубав плаж " когато го кажа много бързо. Програмата трябва да анализира фонемите, използвайки фразата, която бе преди него, за да го направим. Ето разбивка на две фрази:
<р> р а к д ао н ай Z ите р Iy гл

" признае реч "
<р> р а к ай ай п ите б Iy гл

" развалина хубав плаж "
<р> Защо това е толкова сложно? Ако една програма има речник от 60000 думи (често в днешните програми), последователност от три думи може да бъде всеки един от 216 трилиона възможности. Очевидно е, че дори и най-мощният компютър не може да се търси чрез всички от тях, без някаква помощ.
<Р> Това помощ идва под формата на програма за обучение. Според Джон Garofolo:
Тези статистически системи се нуждаят от много примерни данни за обучение, за да достигне своята оптимална производителност - понякога от порядъка на хиляди часове човешки транскрибира реч и стотици мегабайта текст. Тези данни за обучение се използват за създаване на звукови модели на думи, думата списъци, както и [...] няколко думи вероятностни мрежи. Има известно изкуство как един избира, компилира и подготвя това обучение данни за " " храносмилането; от системата и как системните модели са " " настроен; за конкретно приложение. Тези подробности могат да направят разликата между една система добре работещи и система лошо изпълнение -. Дори и при използване на едни и същи основни алгоритъм <р> Докато разработчиците на софтуер, които създават първоначалната лексиката на системата изпълняват голяма част от това обучение, на края потребителят трябва да прекарат известно време да го обучава. В бизнес среда, основните потребители на програмата, трябва да прекарат известно време (понякога дори само за 10 минути) говори в системата, за да го обучи по конкретните им модели на речта. Те също така трябва да се обучават на системата да разпознава термини и съкращения специално за компанията. Специални издания на програми за разпознаване на реч за медицински или юридически служби имат отношени

Page [1] [2] [3] [4] [5] [6] [7]