Извличане на знание
/ Knowledge Discovery >> Извличане на знание >> тек >> компютър >> интернет >> развитие уеб дизайн >>

Expert Stuff: Googles Mike Cohen

сфер " Това не е като хората ще имитират точно тези думи, но това е разумно предвидима, така че някой с опит, и след слушане на някои от данните, може да има разумен шанс за написването изрично граматика, че каза, " Това са 50 вариации в начина, хората могат да направят, че двупосочна избор ".
<р> има предвид, че, както можете да се по-трудни приложения като, например, гласово търсене, това е много по-трудно да се предскаже всички тези различни низове от думи, които хората могат да пълна. Така че, вместо, граматиката става това, което се нарича статистическа граматика, или това, което ние често наричаме модел статистическа език. Това ще бъде нещо повече под формата на, предвид последните две думи са A, B, тук са вероятностите цяла всички думи на моя език на какво може да се случи по-нататък.
Колко думи са в търсенето на глас Google база данни?
<р> A gazillion.
<р> Така че нека да го кажем така. За английски, страна на лексиката, броят на различните думи в речника ни е приблизително един милион, и с течение на времето, която се развива, защото, очевидно, нови думи навлизат в езика, нови имена идват заедно, така нататък и така нататък, така че получава преоткрит от време на време и то се добавя, също. След това, тези думи могат да бъдат поставени заедно във всеки възможен ред и за всяка дължина на думата низ. Така че може да излезе с заявка от 10 думи, бране на случаен принцип от тези милион думи, така че се оказва един астрономически голям брой. Въпреки това, с помощта на този вид статистически модел език току-що споменах, и го обучава на много и много заявки, стотици милиарди заявки, ние в крайна сметка с разумна прогностична способност за това, което най-вероятно.
Колко изчислителната мощ прави изисква система за разпознаване на реч?
<р> Зависи когато искаш да кажеш. Когато ние всъщност прави признание, в този момент на работа на разпознаване по един CPU, така че на CPU, ние ще, в реално време, направете признаване. Но за да се постигне изпълнението получаваме, с цел изграждане на тези модели, можем да харчат много, много десетилетия на компютъра време, за да се изчисли модела език за английски, тъй като работи в момента. Така че тя се развива с течение на времето, защото ние получаваме повече данни, процесори получите по-бързо и подобни неща, но само за да се обучават един език модел за английски бихме могли да използваме 230000000000, например, думи "струва на данни, както и че може да отнеме няколко десет

Page [1] [2] [3] [4] [5] [6] [7] [8]