Hiroshi G. Okuno japán mesterséges intelligencia kutató és csoportja, olyan robotokat fejlesztettek ki, amelyek több (jelenleg 8) mikrofon segítségével meghatározzák a különböző irányból érkező hangok forrásainak térbeni pozícióját. Ezután a robot elmozdulhat a kiválasztott hangforrás, vagy hangforrások irányába, javítva a jel/zaj viszonyt, majd az egyes hangkomponenseket a forrásokhoz kötve szétválogatja. Ezen kívül a SIG2 illetve Robovie R2 típusú robotok még alkalmazzák az úgynevezett "missing feature mask generation" (kihagyott jellegzetesség maszk generálás) módszert is. Ezzel a rendszer, az által megbízhatatlannak ítélt adatokat (vagyis amit zajnak tekint) kiiktatja. A megmaradt hangot pedig "egyszerűen" összehasonlítva a tárolt 50 millió japán kifejezéssel, megpróbálja azonosítani a hallott szavakat. Egyelőre körülbelül 70 %-os pontossággal működik a rendszer a gyakorlati tesztekben, ami meglehetősen látványos sikernek számít.
A fenti kisfilmben a robot egy pincért játszik, amelynek három férfi egyszerre mondja meg mit akar rendelni. Ezután a robot felsorolja ki mit kért és összesen mennyibe fog ez kerülni nekik.
A gyorséttermi kiszolgálás nem túl magasztos célja mellett a rendszer többek között jó szolgálatot tehet a következő generációs hallókészülékekben. Okuno - aki maga is majdnem süket 10 év nagyon hangos zenehallgatás miatt -, még szélesebb körű alkalmazási lehetőségeket lát az új hallórendszerben, mindenféle emberi beszédet megértő és arra reagáló eszközök formájában.
Scientific American 291:17. alapján
A hírrel kapcsolatos internet oldal:
http://winnie.kuis.kyoto-u.ac.jp/SIG/
Utolsó kommentek