A 8-fülű robot

Behallatszik az utca zaja, megy a televízió, a másik szobából egy kis popzene hallatszik át, valahol csörög egy mobil és valaki épp beszél hozzánk. Mégis értjük mit mond, nem keverjük össze az éppen üvöltő reklámmal - na ez az amit egy robot nem tud, illetve nem tudott eddig. A képen látható robotban több (fül) van mint ami látszik...

Hiroshi G. Okuno japán mesterséges intelligencia kutató és csoportja, olyan robotokat fejlesztettek ki, amelyek több (jelenleg 8) mikrofon segítségével meghatározzák a különböző irányból érkező hangok forrásainak térbeni pozícióját. Ezután a robot elmozdulhat a kiválasztott hangforrás, vagy hangforrások irányába, javítva a jel/zaj viszonyt, majd az egyes hangkomponenseket a forrásokhoz kötve szétválogatja. Ezen kívül a SIG2 illetve Robovie R2 típusú robotok még alkalmazzák az úgynevezett "missing feature mask generation" (kihagyott jellegzetesség maszk generálás) módszert is. Ezzel a rendszer, az által megbízhatatlannak ítélt adatokat (vagyis amit zajnak tekint) kiiktatja. A megmaradt hangot pedig "egyszerűen" összehasonlítva a tárolt 50 millió japán kifejezéssel, megpróbálja azonosítani a hallott szavakat. Egyelőre körülbelül 70 %-os pontossággal működik a rendszer a gyakorlati tesztekben, ami meglehetősen látványos sikernek számít.

A fenti kisfilmben a robot egy pincért játszik, amelynek három férfi egyszerre mondja meg mit akar rendelni. Ezután a robot felsorolja ki mit kért és összesen mennyibe fog ez kerülni nekik.

A gyorséttermi kiszolgálás nem túl magasztos célja mellett a rendszer többek között jó szolgálatot tehet a következő generációs hallókészülékekben. Okuno - aki maga is majdnem süket 10 év nagyon hangos zenehallgatás miatt -, még szélesebb körű alkalmazási lehetőségeket lát az új hallórendszerben, mindenféle emberi beszédet megértő és arra reagáló eszközök formájában.

Scientific American 291:17. alapján

A hírrel kapcsolatos internet oldal:
http://winnie.kuis.kyoto-u.ac.jp/SIG/

Facebook Tumblr Tweet Pinterest Tetszik

2007.09.24. 20:00 | SirMook | 3 komment

Címkék: hírek videó robot hallás mesterséges intelligencia

A bejegyzés trackback címe:

https://akciospotencial.blog.hu/api/trackback/id/tr6174748

Kommentek:

A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

santiago 2007.09.25. 09:35:33

Vajon mit csinálnak az elején a csettintgetéssel? Megmondják, honnan várható a hang? Amúgy a robot beszéde is elég jónak hangzik.

Válasz erre

SirMook · http://akciospotencial.blog.hu/ 2007.09.25. 10:48:29

Santiago,
Őszintén? Csak találgatni tudok, de az az érzésem hogy csak a mikrofonokat tesztelte a srác. Nyilván van valami visszajelző - ami nekünk nem volt látható - ami jelzi, ha a robot mikrofonjai be vannak kapcsolva és érzékelik a hangokat. Azért nem hiszem, hogy a hangforrás-helyzet megadása volt, mert a csettintő kezek pozíciója nem felet meg sem a saját, sem a másik srác helyének, szóval akkor inkább félrevezetés lett volna. Szerintem csak hangpróba volt, mint amikor valaki megpöckölgeti, vagy ráfúj a mikrofonra, hogy ellenőrizze. Japánból nagyon gyenge vagyok (...) és nem tudom mennyire volt ékes a robot japánja. Gyanús viszont, hogy amikor megkérdezi akarnak-e még valamit, a válasz japánul "ie" inkább csak "nem"-et jelenthet mint a "köszönöm, nem"-et (amit angolul írtak ki).
A honlapon a "Demonstration"-ben van sok másik video is. Kiderül az is, hogy dolgoznak és vannak eredményeik a robot által látott képen meghatározott objektumok és az általa hallott hangok forrásainak összekötésén.

Válasz erre

psychenova · http://akciospotencial.blog.hu 2007.09.25. 10:51:55

Szerintem kalibrálják a robotot néhány lokalizált hangforrással.

Egyébként érdekes, miért pont a csettintgetést használják. MedIQ-nál láttam nemrég egy videót egy vak fiúról, aki nyelvcsettintgetéssel tájékozódik.
mediq.blog.hu/2007/09/19/video_egy_hihetetlen_fiurol

Válasz erre

Utolsó kommentek

A cserkész: Látom ilyen segítőkész, nyitott emberek vagytok. Csak azt nem tudom ha itt most valaki jönne és az... (2014.02.19. 16:37) Videók az agyból - a szinapszis
A cserkész: Nagyon állat ez a videó! :D (2014.02.19. 16:18) Videók az agyból - a szinapszis
uzrksghfskbuzs (törölt): Lesz még folytatás? Mert nagytakarítást tartok az RSS olvasómban... (2013.07.03. 15:50) Börtönbe zárt molekulák
ipartelep: @psychenova: "nincs összefüggés a politikai orientáció és az észbeli képességek között." Ez bizt... (2012.04.19. 13:31) Más a konzervatívok és a liberálisok agya
Mateahos: MUHAHA!Rég olvastam ekkora baromságot. (2012.04.03. 19:00) Más a konzervatívok és a liberálisok agya
nemstatikus: @SirMook: Igen, érdemes. Nagyon szórakoztató volt. :) Főleg az a rész, mikor "...immunrendszer fel... (2012.03.24. 19:06) Az ősbaktériumok erejével
hipopotézis: @psychenova: Köszönöm a választ, és újabb kérdéssel fordulok hozzátok. Az akciós potenciál az érző... (2012.01.31. 20:49) A memória alapjai
Utolsó 20

Ajánlj témát!

Kik vagyunk mi?

Utolsó kommentek

Szerzők

Keresés

RSS feed

Rovatok

Címkék

Blogroll

Innen merítünk

creative commons

Egyéb