Извличане на знание
/ Knowledge Discovery >> Извличане на знание >> тек >> компютър >> интернет >> развитие уеб дизайн >>

Expert Stuff: Googles Mike Cohen

Expert Stuff: Mike Cohen на Google
Expert Stuff: Google Майк Коен
<р> Управител на Speech Technologies Mike Cohen на Google разбира речта на ниво повечето от нас не си помисля. Той го разбира по базово ниво на звукови съчетания и контекстуални улики. Той трябва да - той е отговарял за отдел в Google, който работи на технология за разпознаване на реч
<р> Преподаване на компютър да разпознава речта е трудно.. За да се разбере на английски, има много препятствия трябва да преодолеят. В английския език има много омоними - думи, които звучат фонетично същото, но означават различни неща. Мислете за " да, " " " две; и " " прекалено.; Хората говорят с акцент или в регионален диалект може да произнася думи по начин, който е коренно различно от стандартното произношение. И тогава там са думи като " " маршрут; че имат заместници произношения - може да се каже " " корен; или " " разгром; и двете са верни.
<р> Как да ви научи на един компютър, за да направят тези разлики? Как може една машина се разбере това, което казваме и реагира по подходящ начин? Това са предизвикателствата Коен и неговия екип в лицето на Google. Говорихме с Коен и го помолил да даде повече подробности за работата си в областта на изследванията и приложения за разпознаване на реч.
<Р> На всяка страница, ще видите нашите въпроси в заглавието и отговори Коен в организма. Ние започнахме с основите на технологията за разпознаване на реч, както ще видите на следващата страница.
Как технология за разпознаване на реч работа по основно ниво?
<Р> ОК, така че принципно, начинът, по който в областта е отишло през последните няколко десетилетия е все повече и повече към подходи данни задвижване или статистическа-моделиране. Какво искам да кажа от това е по-скоро, отколкото като хора влизат и се опитват да програмирате всички тези правила или всички от тези описания на това как работи езика, ние се опитахме да изгради модели, където бихме могли да се хранят много и много данни за моделите, както и моделите Ще научите повече за структурата на речта от данните. Така подходи данни задвижване са подходи въз основа на изграждането на големи статистически модели на езика, като го хранят много данни.
<Р> Това е първият принцип, и че движение към машинно обучение, или данни задвижване или статистически подходи беше всъщност една от най-важните постижения в историята на полето за разпознаване на реч. И така, въпр

Page [1] [2] [3] [4] [5] [6] [7] [8]