<р> Кучета тичам повече, отколкото те правят неща с тигани, и така чрез хранене много данни за този модел -. Ние го наричат на език модел. Това е най-статистическия модел на думата последователности, каква е вероятността на различните думи са да възникнат предвид това, което последните думи са били. Чрез подаване на образците на много данни, той просто изчислява всички тези статистически данни за това, което е вероятно да се случи след това, и това е моделът на език. Така че сега, тези три модела, акустичният модел или модел с всички тези основни звуци, лексикона, или модел за това как всички думи получат изразени, и най-накрая на модела език, или как всички тези думи се нанизани заедно да съставят заедно.
<р> Така лексикалните модели са изградени като се нанизват заедно акустични модели, модел език е изградена като се нанизват заедно дума модели, и всичко това стане компилиран в една огромна представителство на говоримия английски, да речем, и че става модела, който получава научил от данни, както и че се признава или търсения, когато някои акустика дойде и тя се нуждае, за да разберете какво е най-добрият ми предположение какво току що каза.
Как се вземат предвид акценти и диалекти при разработването на речта за разпознаване ?
<р> Един от основните неща, като се има предвид вида на подход данни задвижване, която ние приемаме, е да се опитаме да имат много големи, широки комплекти за обучение. Ние имаме големи количества данни идващи от всякакви хора с всякакви акценти, казват най-различни неща, и така нататък и така нататък, и най-важното нещо е да има добро покритие във вашия обучение набор от каквото и да е смешен . в Имаме достатъчно копия на Бруклин акценти - и то не само благодарение на мен - но ние имаме хора от Бруклин, че са говорили с нашите системи са такива, че ние вършат добре работата, когато хора с Бруклин акценти говорят с нашата система <Бразилски.>
От друга страна, ако някой дойде и имаше много странни и необичайни начини за произнасяне неща, които не е добре обхванати в нашите данни, щяхме да имат повече проблеми с разпознаването им.
<р> Поняк