Ajánlj témát!

Miről szeretnél olvasni nálunk? Ha nem árulod el, csak találgatunk. Írjatok arról, hogy...

Kik vagyunk mi?

Az Akciós Potenciál egy agykutatással illetve más biológiai témákkal foglalkozó fiatalokból álló baráti, munkatársi közösség. Azért indítottuk a blogot, hogy az általunk űzött tudományágak új eredményeit közérthető módon, érdekesen mutassuk be az érdeklődöknek. Nem törekszünk tudományos igényű részletességre, de nem is elégszünk meg annyival, hogy "brit tudósok kimutatták..."

Utolsó kommentek

Szerzők

RSS feed

Rovatok

Címkék

creative commons

Creative Commons License
Terjeszd, használd, hivatkozd

Egyéb

A 8-fülű robot

Behallatszik az utca zaja, megy a televízió, a másik szobából egy kis popzene hallatszik át, valahol csörög egy mobil és valaki épp beszél hozzánk. Mégis értjük mit mond, nem keverjük össze az éppen üvöltő reklámmal - na ez az amit egy robot nem tud, illetve nem tudott eddig. A képen látható robotban több (fül) van mint ami látszik...

Hiroshi G. Okuno japán mesterséges intelligencia kutató és csoportja, olyan robotokat fejlesztettek ki, amelyek több (jelenleg 8) mikrofon segítségével meghatározzák a különböző irányból érkező hangok forrásainak térbeni pozícióját. Ezután a robot elmozdulhat a kiválasztott hangforrás, vagy hangforrások irányába, javítva a jel/zaj viszonyt, majd az egyes hangkomponenseket a forrásokhoz kötve szétválogatja. Ezen kívül a SIG2 illetve Robovie R2 típusú robotok még alkalmazzák az úgynevezett "missing feature mask generation" (kihagyott jellegzetesség maszk generálás) módszert is. Ezzel a rendszer, az által megbízhatatlannak ítélt adatokat (vagyis amit zajnak tekint) kiiktatja. A megmaradt hangot pedig "egyszerűen" összehasonlítva a tárolt 50 millió japán kifejezéssel, megpróbálja azonosítani a hallott szavakat. Egyelőre körülbelül 70 %-os pontossággal működik a rendszer a gyakorlati tesztekben, ami meglehetősen látványos sikernek számít.



A fenti kisfilmben a robot egy pincért játszik, amelynek három férfi egyszerre mondja meg mit akar rendelni. Ezután a robot felsorolja ki mit kért és összesen mennyibe fog ez kerülni nekik.
A gyorséttermi kiszolgálás nem túl magasztos célja mellett a rendszer többek között jó szolgálatot tehet a következő generációs hallókészülékekben. Okuno - aki maga is majdnem süket 10 év nagyon hangos zenehallgatás miatt -, még szélesebb körű alkalmazási lehetőségeket lát az új hallórendszerben, mindenféle emberi beszédet megértő és arra reagáló eszközök formájában.

Scientific American 291:17. alapján

A hírrel kapcsolatos internet oldal:
http://winnie.kuis.kyoto-u.ac.jp/SIG/

2007.09.24. 20:00 | SirMook | 3 komment

Címkék: hírek videó robot hallás mesterséges intelligencia

A bejegyzés trackback címe:

https://akciospotencial.blog.hu/api/trackback/id/tr33174748

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

santiago 2007.09.25. 09:35:33

Vajon mit csinálnak az elején a csettintgetéssel? Megmondják, honnan várható a hang? Amúgy a robot beszéde is elég jónak hangzik.

SirMook · http://akciospotencial.blog.hu/ 2007.09.25. 10:48:29

Santiago,
Őszintén? Csak találgatni tudok, de az az érzésem hogy csak a mikrofonokat tesztelte a srác. Nyilván van valami visszajelző - ami nekünk nem volt látható - ami jelzi, ha a robot mikrofonjai be vannak kapcsolva és érzékelik a hangokat. Azért nem hiszem, hogy a hangforrás-helyzet megadása volt, mert a csettintő kezek pozíciója nem felet meg sem a saját, sem a másik srác helyének, szóval akkor inkább félrevezetés lett volna. Szerintem csak hangpróba volt, mint amikor valaki megpöckölgeti, vagy ráfúj a mikrofonra, hogy ellenőrizze. Japánból nagyon gyenge vagyok (...) és nem tudom mennyire volt ékes a robot japánja. Gyanús viszont, hogy amikor megkérdezi akarnak-e még valamit, a válasz japánul "ie" inkább csak "nem"-et jelenthet mint a "köszönöm, nem"-et (amit angolul írtak ki).
A honlapon a "Demonstration"-ben van sok másik video is. Kiderül az is, hogy dolgoznak és vannak eredményeik a robot által látott képen meghatározott objektumok és az általa hallott hangok forrásainak összekötésén.

psychenova · http://akciospotencial.blog.hu 2007.09.25. 10:51:55

Szerintem kalibrálják a robotot néhány lokalizált hangforrással.

Egyébként érdekes, miért pont a csettintgetést használják. MedIQ-nál láttam nemrég egy videót egy vak fiúról, aki nyelvcsettintgetéssel tájékozódik.
mediq.blog.hu/2007/09/19/video_egy_hihetetlen_fiurol