A cég kutatói olyan beszédfelismerő rendszert alkottak, amely a társalgási beszédet már az emberekéhez hasonló szinten képes „átírni”.
Egy hétfőn közzétett tanulmányban a tudósok arról számoltak be, hogy a múlt havi, rekordnak számító 6,3 százalékos mérték után, a beszédfelismerő rendszerük most már elérte az 5,9 százalékos szóhibaarányt (WER – word error rate). Az 5,9 százalékos hányad már körülbelül megegyezik az emberével, vagyis egyazon beszélgetés alatt a mesterséges és a természetes (humán) intelligencia ugyanannyi szöveget enged el a füle mellett.
„Elértük az emberi szintet – mondta Xuedong Huang, a vállalat beszédtudományos részlegének vezető kutatója. – Ez egy történelmi jelentőségű vívmány.”
Jó, de nem hibátlan. Ez az eredmény nem jelenti azt, hogy a számítógép felismer minden szót. Ebben az esetben a Microsoft beszédfelismerő rendszere „csak” az emberi szintet érte el, és nem tökéletes.
A fejleménynek messzemenő hatásai lesznek. A Micrososoft saját termékei, mint a Cortana és az Xbox azonnal profitálhatnak a tudósok által kifejlesztett technológiából.
Azonnali átírásos szolgáltatásokkal a technológia például a fogyatékkal élők mindennapjait is megkönnyítheti.
A csapat most még tovább növelné a precizitást, illetve lehetővé tennék, hogy a beszédfelismerő rendszert később zsúfolt utcákon vagy vezetés közben is használni lehessen.
