Ihmisen näkemyksen innoittamat visiojärjestelmät


MIT: n neurotieteilijöiden ryhmä on MIT: n 21. helmikuuta 2007 julkaiseman artikkelin mukaan kehittänyt tietokonemallin, joka jäljittelee ihmisen näköjärjestelmää havaitsemaan ja tunnistamaan tarkasti esineet, kuten autot ja moottoripyörät, vilkkaalla kadulla. MIT: n neurotieteilijän Thomas Serren mukaan tämän tyyppisiä näköjärjestelmiä voitaisiin pian käyttää valvontajärjestelmissä tai älykkäissä antureissa, jotka varoittavat kuljettajia jalankulkijoiden tai muiden esineiden läsnäolosta.

Tutkijat ovat vuosien ajan yrittäneet matkia biologisia näköjärjestelmiä niiden täydellisyyden vuoksi. Mutta tietokoneen opettaminen luokittelemaan esineitä on osoittautunut monimutkaisemmaksi kuin alun perin näytti, kertoo Tomaso Poggion kanssa työskennellyt Serre. Ensinnäkin tietyn tyyppisen esineen tunnistamiseksi tietokone tarvitsee erityisen laskennallisen mallin tai kyseisen objektin esityksen, mikä antaa tietokoneelle mahdollisuuden erottaa esimerkiksi auto kohteista, jotka eivät ole autoja. Mallin on kuitenkin oltava riittävän joustava, jotta se mahtuu kaikentyyppisiin autoihin eri kulmissa ja asennoissa ja erilaisissa valaistusolosuhteissa.

Paras tapa saavuttaa tämä on kouluttaa oppisalgoritmi, jossa on kuvasarja, jotta poistetaan niiden yhteiset ominaisuudet. Serre ja Poggio uskovat, että ihmisen näköjärjestelmä noudattaa samanlaista lähestymistapaa, mutta että se riippuu visuaalisen aivokuoren peräkkäisten kerrosten hierarkiasta. Kuoren ensimmäiset kerrokset havaitsisivat siten kohteen yksinkertaisimmat ominaisuudet ja viimeiset yhdistivät kyseisen tiedon muodostaen käsityksemme kokonaisuudesta.

Teoriansa testaamiseksi Serre ja Poggio työskentelivät yhdessä MIT: n Stanley Bileschin ja Israelin Tel Aviv -yliopiston Lior Wolfin kanssa luodakseen 10 miljoonan laskentayksikön tietokonemallin, joka on tarkoitettu käyttäytymään kuin neuroniryhmät. visuaalisen aivokuoren. Kuten visuaalisessa aivokuoressa, yksiköt jaetaan kerroksiin.

Ensinnäkin yksinkertaisimmat yksiköt purkavat alkeelliset piirteet kohtauksesta (esimerkiksi suuntautuneet profiilit) analysoimalla erittäin pieniä pikseliryhmiä. Monimutkaisemmat yksiköt analysoivat sitten kuvan suurempia osia ja tunnistavat objektien kokoon tai sijaintiin liittyvät ominaisuudet. Kullakin peräkkäisellä kerroksella poimitaan yhä monimutkaisempia ominaisuuksia, kuten esineen kahden osan välinen etäisyys tai näiden osien erilaiset suuntauskulmat. Tämän avulla voit tunnistaa saman kohteen eri kulmista.

Järjestelmää testattaessa heidän tulokset olivat erittäin hyviä, koska he pystyivät kilpailemaan markkinoiden parhaiden järjestelmien kanssa. Lisäksi sen oppimiskyvyn vuoksi, mitä enemmän kuvia analysoit, sitä tarkempia tulokset ovat.
Tällä hetkellä järjestelmä on suunniteltu vain staattisten kuvien analysointiin. Serren mukaan prosessi on kuitenkin samanlainen kuin ihmisen visiojärjestelmän, jossa järjestelmän yksi osa vastaa muodoista ja toinen liikkeestä. Ryhmä pyrkii nyt sisällyttämään rinnakkaisen järjestelmän, joka toimii videoiden kanssa.

Lähde: Technology Review


Video: Sub Press conference with Dimash in Moscow, 2020


Edellinen Artikkeli

Maailman parhaat luonnonpuistot

Seuraava Artikkeli

Kuinka valita matto käytäville ja käytäville