TietokoneetTietotekniikka

Moderni konenäön. Tehtävät ja konenäön tekniikkaa. Ohjelmointi Computer Vision Python

Miten opettaa tietokoneen ymmärtää, mitä on kuvattu kuvan tai kuvia? Tämä vaikuttaa yksinkertaiselta, mutta tietokone tämä on vain matriisi muodostuen nollia ja ykkösiä, josta haluat purkaa tärkeitä tietoja.

Mikä on konenäön? Se on kyky "nähdä" tietokoneen

Vision - on tärkeä tietolähde henkilö käyttää sitä, saadaan mukaan eri arvioiden 70-90% kaikista tiedon. Ja tietenkin, jos haluamme luoda älykkään auton, meidän on toteutettava samoja taitoja ja tietokoneen.

Ongelma konenäön voidaan todeta aivan selvästi. Mikä on "nähdä"? On selvää, että jos on vain katsomalla. Että päätökseen erot konenäön ja ihmisen visio. Visio meille - se on lähde tietoa maailmasta, sekä lähde riikkainformaatio - eli kyky ymmärtää etäisyydet ja koot.

Semanttinen ytimen

Tarkasteltaessa kuvaa, voimme kuvata sitä useilla attribuutteja, niin sanotusti, poimia semanttista informaatiota.

Esimerkiksi katsomalla tätä kuvaa, voimme sanoa, että se on ulkona. Mikä on kaupunkiliikenteessä. Että on olemassa autoja. Voimme arvata, että tämä on Kaakkois-Aasian kokoonpanosta rakennuksen ja hieroglyfejä. Muotokuva Mao Zedong ymmärtää, että tämä on Pekingissä, ja jos joku näki suoraa videokuvaa tai itse ollut siellä, voisi arvata, että tämä on kuuluisa Tiananmenin aukio.

Mitä voimme sanoa lisää kuvan, nähdä sen? Voimme tunnistaa esineitä kuvan, sanoa, että on olemassa ihmisiä lähemmäs - aita. Täällä sateenvarjot, että rakennuksen julisteita. Nämä ovat esimerkkejä luokista on hyvin tärkeä esineitä, jotka harjoittavat etsiä hetkellä.

Silti voimme oppia joitakin ominaisuuksia tai ominaisuuksia esineitä. Esimerkiksi täällä voimme todeta, että tämä ei ole muotokuva tavalliset kiinalaiset, eli Mao Zedong.

Mukaan ajoneuvo voidaan määrittää, että se on liikkuvan kohteen, ja se on kova, se ei ole muotoaan liikkeen aikana. Tietoja liput voidaan sanoa, että se vastustaa, ne ovat myös siirtymässä, mutta ne eivät ole kovia, jatkuvasti muotoaan. Ja kohtaus on tuuli, joka voidaan määrittää kehittämällä lippuja, ja voi jopa määrittää tuulen suunta, esimerkiksi, se puhaltaa vasemmalta oikealle.

Etäisyydet ja pituudet konenäkö

Erittäin tärkeää on metrinen tietoa konenäön tieteestä. Tämä on kaikenlaisia matkoja. Esimerkiksi Rover on erityisen tärkeää, koska joukkueet ovat Maasta noin 20 minuuttia ja vastata niin paljon. Vastaavasti linkki sinne ja takaisin - 40 minuuttia. Ja jos me tehdä suunnitelma liikkeen komentoja maapallon, sinun täytyy ottaa tämä huomioon.

Onnistuneesti integroitu tekniikka konenäön videopelit. Mukaan videon, voit rakentaa kolmiulotteisia malleja esineiden, ihmisten ja valokuvia käyttäjä voi palauttaa kolmiulotteisia malleja kaupunkien. Ja sitten kävellä niitä.

konenäön - melko laajalla alueella. Se on läheisesti sidoksissa monien muiden tieteiden. Osa konenäön Se tallentaa kuvankäsittelyn alue ja joskus jakaa konenäköön, historiallisesti.

Analyysi, hahmontunnistus - polun luomiseen ylivoimainen älykkyys

Tutkitaanpa näitä käsitteitä erikseen.

Kuvankäsittely - tämä on alue algoritmeja, joissa tulo ja lähtö - kuva, ja meillä on hänen tekevän jotain.

kuva-analyysi - on alue konenäkö, joka keskittyy kanssa kaksiulotteisen kuvan ja tehdä johtopäätöksiä.

Pattern Recognition - abstrakti matemaattinen tieteenala, joka tunnistaa datan muodossa vektorit. Eli suulla - vektori ja meillä on jotain tekemistä sen kanssa. Jolloin vektori on, emme ole niin tärkeää tietää.

Konenäkö - se alunperin oli palauttaa rakenteen kaksiulotteisten kuvien. Nykyisin seutu on laajentunut ja se voidaan tulkita sen hyväksymiseksi kaikkien fyysisten esineiden tekeminen, kuvan perusteella. Eli se on tehtävä tekoälyn.

Rinnakkain konenäkö täysin eri alalla geodesian, fotogrammetrian on kehittynyt - mittauksen välisen etäisyyden esineitä kaksiulotteisten kuvien.

Robotit "näkee"

Ja lopuksi - tämä on konenäkö. Alle konenäön tarkoittaa visio robotteja. Se on päätös joidenkin tuotanto-ongelmia. Voimme sanoa, että konenäön - on yksi iso tiedettä. Se yhdistää joitakin muita tieteen osa. Ja kun konenäkö saa mitään erityistä sovellus, se muuttuu konenäkö.

Konenäön alueella massa on käytännön sovelluksia. Se liittyy tuotannon automatisointia. Yritystasolla tehostunut korvata käsityötä koneellisesti. Kone ei kyllästy, en nuku, hän oli epäsäännöllinen työsuunnitelma, hän on valmis työskentelemään 365 päivää vuodessa. Joten, käyttää konetta työtä, saamme taattu tulos tiettyyn aikaan, ja se on varsin mielenkiintoinen. Kaikki tehtävät on selkeä käyttöä tietokonenäköjärjestelmiin. Ja ei ole mitään parempaa kuin nähdä tuloksia heti kuvassa vain laskennassa vaiheessa.

Kynnyksellä maailman tekoälyn

Plus alue - se on kova! Merkittävä osa aivojen vastuussa visio, ja uskotaan, että jos opettaa tietokoneen "nähdä", joka on, täysimääräinen hyödyntäminen konenäkö, se on yksi tavoitteista täyden tekoäly. Jos voimme ratkaista ongelman ihmisen tasolla, todennäköisesti samalla, me ratkaista AI. Se on erittäin hyvä! Tai ei kovin hyvä, jos tarkastellaan, "Terminator 2".

Miksi on visio - se on vaikeaa? Koska kuva samasta kohde voi vaihdella suuresti riippuen ulkoisista tekijöistä. Riippuen kohteen näytealaverkoston näyttävät erilaisilta.

Esimerkiksi, yksi ja sama luku, joka on otettu eri näkökulmista. Ja mikä on mielenkiintoisin luku voi olla yksi silmä, kaksi silmää ja puoli. Ja asiayhteydestä riippuen (jos tämä kuva mies paita maalattu silmät), silmä voi olla enemmän kuin kaksi.

Tietokone ei edelleenkään ymmärrä, mutta se "näkee"

Toinen tekijä, joka vaikeuttaa - se on valaistus. Samasta aiheesta eri valaistusolosuhteissa näyttää erilaiselta. objektin koko voi vaihdella. Lisäksi mitään esineitä luokan. Kuinka voit sanoa mies, että hänen 2 metriä? Mitään. Ihmisen kasvuun ja se voi olla 2,3 m, ja 80 cm. Kuten muidenkin tyyppisten esineiden, kuitenkin, ovat esineitä samaan luokkaan.

Erityisen elävä esineet tehdään erilaisia kantoja. Hiukset ihmiset, urheilijat, eläimiä. Katso kuvia hevosten, selvittää mitä tapahtuu niiden harja ja häntä on yksinkertaisesti mahdotonta. Päällekkäisen objektien kuvan? Jos pistää tietokoneen kuvaa, vaikka tehokkain kone löytää vaikeuksia antaa oikean päätöksen.

Seuraava näkymä - se on valepuvussa. Joitakin esineitä, eläimiä naamioitunut ympäristöön, ja melko taitavasti. Ja sama täplät ja väritys. Silti näemme ne, joskaan ei aina kaukaa.

Toinen ongelma - liikkeen. Esineitä liikkeessä käsittämättömän deformoitua.

Monet esineet ovat hyvin vaihtelevia. Tässä esimerkiksi, että kaksi kuvaa alapuolella objektit "tuolin".

Ja tästä voi istua. Vaan opettaa koneeseen, niin että eri asioita muoto, väri, materiaali, kaikki on objekti "tuoli" - on hyvin vaikeaa. Tämä on haaste. Integroida menetelmiä konenäkö - on opettaa kone ymmärtää, analysoida, spekuloida.

Integrointi konenäön eri alustoilla

Massa konenäkö alkoi tunkeutua enemmän vuonna 2001, kun hän loi ensimmäisen pinnan ilmaisin. Me teimme sen kaksi tekijää: Viola, Jones. Se oli ensimmäinen nopean ja luotettavan riittävän algoritmi, joka osoitti voiman koneälyyn.

Nyt konenäkö on tarpeeksi uusia käytännön sovelluksia - tunnustetaan ihmisen kasvot.

Mutta tunnistaa miehen elokuvissa - sattumanvaraisesti näkökulmista, eri valaistusolosuhteissa - on mahdotonta. Mutta ongelman ratkaisemiseksi, tai yksi, joka on eri ihmiset eri valaistus tai eri aiheuttaa, samanlainen kuin valokuvan passiin, on mahdollista suurella varmuudella.

passikuvan vaatimuksia paljolti ominaisuus kasvojentunnistus algoritmit.

Esimerkiksi, jos sinulla on biometrinen passi, joissakin moderni lentokentillä, voit käyttää automaattista passia valvontajärjestelmä.

Ratkaisematon ongelma konenäön - kyky tunnistaa tekstiä

Ehkä joku käyttää tekstintunnistusjärjestelmään. Yksi näistä - Fine Reader on erittäin suosittu RuNet järjestelmässä. On olemassa monia muotoja, joissa täytät tietoja, ne ovat täysin skannattu, tieto tunnistaa järjestelmän hyvin. Mutta mitään tekstiä kuvassa tilanne on paljon pahempi. Tämä ongelma on edelleen ratkaisematta.

Peleissä jossa konenäkö, motion capture

Erillinen iso alue - on luoda kolmiulotteisia malleja ja motion capture (mikä on varsin onnistuneesti tietokonepeleissä). Ensimmäinen ohjelma, joka käyttää tietokonetta vision - järjestelmä vuorovaikutuksen tietokoneeseen eleitä. Kun se on luotu se oli paljon asioita auki.

Algoritmi on suunniteltu yksinkertaisesti, mutta määrittää kesti luoda generaattori synteettisten kuvia ihmisistä saada miljoona kuvaa. Supertietokone heidän valita parametrit algoritmin, josta hän nyt toimii hyvin.

Se on miljoonaa kuvaa ja viikon laskettavissa supertietokone aikaa mahdollista luoda algoritmi, joka kuluttaa 12% kapasiteetista yhden prosessorin ja sallii henkilön hahmottaa sijaintinsa reaaliajassa. Tämä Microsoft Kinect järjestelmä (2010).

Etsi kuvien sisällön voit lähettää kuvia järjestelmään, ja sen tulokset antavat kaikki kuvat, joilla on sama sisältö ja valmistettu samasta kulmasta.

Esimerkkejä konenäön: kolmiulotteinen ja kaksiulotteinen kartat ovat nyt tehneet sen kanssa. Navigointikarttojen autojen päivitetään säännöllisesti DVR.

On tietokanta miljardeja geokoodattujen kuvia. Lataamalla kuvan tietokantaan, voit määrittää, missä se on tehty, ja jopa joidenkin näkökulmasta. Tietenkin, jos paikka on suosittu riitä, että kerralla turistit ja teki useita kuvia alueella ovat olleet siellä.

robotit ovat kaikkialla

Robotiikka tällä hetkellä kaikkialla, ilman sitä millään tavalla. Nyt on olemassa ajoneuvoja, joissa on erityinen kameroita, jotka tunnistavat jalankulkijat ja liikennemerkit lähettämään komentoja kuljettaja (tällä tavalla tietokoneohjelma tarkastella, auttaa autoilijan). Ja on täysin automatisoitu robotti ajoneuvoja, mutta ne eivät voi luottaa pelkästään videokamerajärjestelmää ilman suuren määrän lisätietoa.

Moderni kamera - tämä on analoginen Camera Obscura

Puhutaanpa digitaalisen kuvan. Nykyaikaiset digitaalikamerat järjestetään periaatteeseen camera obscura. Vain sijasta reiän, jonka läpi valo tulee säteen ja projisoidaan takaseinän kammion aihe piiri, meillä on erityinen optinen järjestelmä nimeltään linssi. Sen tarkoituksena on kerätä suuri valonsäteen ja muuntaa niin, että kaikki säteet läpi virtuaalinen piste, jotta saadaan uloke ja kuvan muodostamiseksi kalvo tai matriisi.

Nykyaikaiset digitaalikamerat (matriisi) koostuu yksittäisistä elementeistä - pikseliä. Jokainen pikseli voi mitata energiaa valoa, joka osuu pikselin koko, ja antaa yhden lähdön numero. Siksi digitaalikameran, saamme sen sijaan kuvan valoisuuden Valomittauksia kiinni yksittäisen pikselin - tietokone näkökenttä. Siksi, kun kuva näemme ei virtaa linjat ja selkeät ääriviivat, ja verkkoon värillisiä neliöitä eri värejä - pikseliä.

Alla näet ensimmäisen digitaalisen kuvan maailmassa.

Mutta tässä kuvassa ei ole? Väri. Mikä väri?

Psykologinen värinhavaitsemiserot

Väri - tämä on mitä näemme. Värin yksi ja sama asia ihmisille ja kissoille on erilainen. Koska me (ihmiset) ja eläinten optisen järjestelmän - visio on erilainen. Siksi väri - se on psykologista laatua visiomme joka syntyy, kun tarkkailemalla esineitä ja valoa. Eikä fysikaalisen ominaisuuden kohteen ja valo. Väri - on tulosta vuorovaikutuksesta kevyet komponentit, ja kohtaus meidän visuaalisen järjestelmän.

Ohjelmointi Computer Vision Python kirjastojen

Jos olet päättänyt sitoutua vakavasti tutkimuksessa konenäkö, tulisi välittömästi valmistella useita ongelmia, tämä tiede ei ole helpoin ja kätkee useita sudenkuoppia. Mutta "Ohjelmointi Computer Vision on Python" laatija Jan Erik Solema - kirja, joka esitellään kaikki kaikkein yksinkertaista kieltä. Täällä tutustuu kirjaamis- erilaisten esineiden 3D, oppia työskentelemään stereokuvaa, virtuaalitodellisuus ja moniin muihin sovelluksiin konenäön. Kirjassa on tarpeeksi esimerkkejä Python. Mutta selityksiä on esitetty, niin sanotusti, yleistynyt, jotta ei kuormiteta liikaa tutkimusta ja kovaa dataa. Työskennellä sopii opiskelijoille, harrastajille ja harrastajille. Ladata tämän kirjan ja muille konenäköön (pdf-muodossa) voi olla verkossa.

Tällä hetkellä on avoimen lähdekoodin kirjaston konenäön algoritmeja ja kuvankäsittelyn ja numeerisia algoritmeja OpenCV. Se on toteutettu nykyaikaisin ohjelmointikieliä, on avoimen lähdekoodin. Jos puhumme konenäkö, Python käyttöä ohjelmointikieli, se on myös tukea kirjaston lisäksi se muuttuu jatkuvasti ja on suuri yhteisö.

Yhtiö "Microsoft" tarjoaa palveluitaan API pystyvät kouluttamaan hermoverkko työskennellä sen kanssa kuvia ihmisistä. On myös mahdollisuus hakea konenäkö, Python käyttöä ohjelmointikieli.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 fi.delachieve.com. Theme powered by WordPress.