Извличане на знание
/ Knowledge Discovery >> Извличане на знание >> тек >> електроника >> джаджи >>

Как разпознаване на реч Works

и друг потребител.
<Р> системи за разпознаване на реч, направени преди повече от 10 години също са изправени пред избор между дискретни и продължително говорене. Тя е много по-лесно за програмата, за да се разбере думи, когато ги говори отделно, с ясно изразена пауза между всеки един. Въпреки това, повечето потребители предпочитат да говорят в един нормален, разговорен скорост. Почти всички съвременни системи са в състояние да разберат продължително говорене.
Благодаря Ти <р> За тази статия, ние говори с Джон Garofolo, Мениджър Speech Group в Technology лаборатория на информация на Националния институт за стандарти и технологии. Ние също бихме искали да благодарим на Joshua Senecal за неговата помощ с тази статия.
Speech да Data
<р> За да се превърне реч на екрана текст или компютърна команда, компютър трябва да премине през няколко сложните етапи , Когато говорите, вие създавате вибрации във въздуха. Преобразувателят на аналогово-цифров (ADC) превежда този аналогов вълна в цифрови данни, че компютърът може да разбере. За да направи това, той проби, или цифровизира, звукът, като точни измервания на вълната на чести интервали. Системата филтри цифровизираните звукът да премахнете нежелания шум, а понякога и да я разделят на различни обхвати на честота (честотата е дължината на вълната на звуковите вълни, чути от хората като разликите в катран). Той също така нормализира звука, или да го настройва за постоянно ниво на звука. Тя може също така да бъде временно изравнени. Хората не винаги говорят със същата скорост, така че звукът трябва да се регулира, за да съответства на скоростта на шаблон звукови проби вече се съхраняват в паметта на системата.
<Р> Next сигналът е разделен на малки сегменти най-къси няколко стотни от секундата, или дори хилядни в случай на взривните съгласните - съгласните спирки, произведени от възпрепятстване на въздушния поток в вокален тракт - като " р " или ". т " Програмата след това съвпада с тези сегменти на известни фонеми на съответния език. A фонема е най-малкият елемент на един език - представяне на звуците, които правим и взети заедно да образуват смислени изрази. Има около 40 фонеми на английски език (различни езиковеди имат различни становища относно точния брой), докато други езици имат повече или по-малко фонеми.
<Р> Следващата стъпка изглежда проста, но това всъщност е най-трудно да постигнете и е т.е. цел на повечето изследвания за разпознаване на реч. Програмата раз

Page [1] [2] [3] [4] [5] [6] [7]