Извличане на знание
/ Knowledge Discovery >> Извличане на знание >> здраве >> медицина >> съвременната медицина >>

Как Google Грипна активност Works

кна от наблюдаваните сезонни пикове на някои видове думи за търсене.
<р> Например, когато пролетните алергии стачка, ние сме по-склонни да търсят антихистамини, отколкото . през зимния грипен сезон на, когато сме по-склонни да търсят информация за нашите простуда и грип симптоми като температура или втрисане
<р> инженерите на Google, използвани пет години от историческата голяма данни - и ние имаме предвид големия. Те подслушвани в тяхната база данни от 50 милиона от най-често използваните prefiltered заявки за търсене, за да се установят изходните на общия разпространение на грипа. Първоначалната алгоритъм за инструмента за предсказване разчита единствено на регионални данни от заявки свързани с грипа Вас (регионално базирани на IP адрес), включително всеобхватни теми като общи симптоми на грип, настинка и антивирусни лекарства.
<Р> Алгоритъмът сравнява недвижими -време данните за заявките за търсене - думата или фраза, която се използва като думата за търсене, като " болки в гърлото " - Спрямо базисните за определяне нивата на регионалното разпространение на грипа, които варират между пет класификации от минимална до интензивна. Теоретично, GFT може да осигури ток-дневен отчитане (в почти реално време) на грипа и предскаже грипни огнища седмици преди CDC съставя доклад.
<Р> Според GFT изобретатели, обаче, отчитане в реално време GFT е предназначена да се използва като допълнителна информация на клинично и вирусологично данните в традиционен наблюдение (контрол на заболяванията и нейните мрежи). Бързо откриване GFT е предназначено да помогне с ранното откриване на не само на епидемии от грип, но и идентификация вирусен щам и потенциала за пандемии
GFT:. Model Updates, Точност и Trap
Big Data <р> Преди всеки нова година на грипния сезон, модела на Google Flu Trends се обновява с 45 от най-полезните заявки грипни свързани от годините преди (тези специални условия за търсене са избрани с помощта на логистична регресия, но точните заявки и как те са претеглени спрямо други се съхраняват Строго секретно).
<р> Освен това, оценки след сезон GFT са оценени спрямо традиционните доклади за наблюдение на данни, използвани от CDC, за да видите колко добре два мача. Въз основа на способността на инструмента прогнози точно да се оцени, когато започва тази година грипен сезон, когато сезонът ще достигне своя връх, и колко тежко ще бъде, моделът може да бъде актуализиран. Когато за първи път през 2008 г., GFT имаха средна ко

Page [1] [2] [3] [4] [5]