Toshiba Corporation ir izstrādājusi AI ar 3D atpazīšanu, kas spēj izmērīt attālumu ar stereo kameras precizitāti, izmantojot ar komerciālo kameru uzņemto attēlu un analizējot attēla izplūšanu, ko rada kameras objektīvs, izmantojot dziļu mācīšanos. Šī tehnoloģija novērsīs stereokameru izmantošanu, kas galu galā samazina izmaksas un vietu. Toshiba iepazīstinās ar šo sasniegumu starptautiskajā konferencē par datoru redzi (ICCV2019), kas notiks Dienvidkorejā 2019. gada 30. oktobrī no pulksten 10:00.
Attēlu uztveršana kļūst arvien svarīgāka, un tādām lietojumprogrammām kā roboti, kas pārvietojas ar objektiem, autonomi bezpilota transportlīdzekļi, tālvadības bezpilota lidaparāti, kas pārbauda infrastruktūru utt., Nepieciešams ne tikai objektu attēlus, bet arī 3D datu analīzei, ieskaitot formu un attālumu, nepieciešama neliela ierīce. Tāpēc pētījumi ir palielināti, lai izstrādātu mērīšanas tehnoloģiju ar monokulārām kamerām (tās ir viegli miniaturizēt), izmantojot dziļu mācīšanos, lai labāk apgūtu attēlotā objekta formu, fonu un citus ainavas datus.
Šai metodei ir trūkums; attāluma precizitāti novērtē ar monokulāras kameras palīdzību atkarībā no iemācītajiem ainavas datiem, kas dažādās ainavās uzņemto kadru dēļ izraisa precizitātes kritumu. Lai to pārvarētu, Toshiba ir izstrādājusi krāsu filtrētu diafragmas fotogrāfiju, kurā pie objektīva ir piestiprināts divu krāsu filtrs, un iegūtā attēla izplūšanas krāsa un izmērs tiek analizēti atbilstoši attālumam no objekta. Lai gan tas atrisina datu atkarības problēmu, esošo lēcu pārveidošana prasa laiku un naudu.
Toshiba ir pārvarējis šo problēmu, izstrādājot AI ar 3D atpazīšanas tehnoloģiju, kas izmanto dziļu mācīšanos, lai analizētu, kā attēls tiek izplūdis atbilstoši tā novietojumam objektīvā, lai sasniegtu attāluma mērīšanu ar tikpat lielu precizitāti kā stereo kameru sistēma., ar parastu monokulāro kameru, bet bez dekorācijas datiem. Līdz šim tika uzskatīts, ka teorētiski nav iespējams izmērīt attālumu, pamatojoties uz izplūduma formu, kas ir vienāda objektiem ar attālumu un tālu, ja tie atrodas vienādā attālumā no fokusa punkta. Bet analītiskie rezultāti ir parādījuši būtisku atšķirību starp izplūdušajām formām tuvu un tālu no objektiem, pat ja tie atrodas vienādā attālumā no fokusa punkta. Līdz ar to Toshiba veiksmīgi analizēja aizmigloto attēlu aizmiglojuma datus, izmantojot dziļu mācību moduli, kas apmācīts ar dziļo neironu tīkla modeli.
Kad gaisma iziet cauri lēcai, ir zināms, ka izveidotā izplūduma forma mainās atkarībā no gaismas viļņa garuma un tās stāvokļa lēcā. Izstrādātajā tīklā atrašanās vieta un krāsa tiek apstrādāti atsevišķi, lai pareizi uztvertu izplūšanas formas izmaiņas, un pēc tam, kad ir iziets caur svērto uzmanības mehānismu, kontrolētu, kur spilgtuma gradientā fokusēties, lai pareizi izmērītu attālumu. Mācoties, pēc tam tīkls tiek atjaunināts, lai samazinātu kļūdu starp izmērīto attālumu un faktisko attālumu. Izmantojot šo AI moduli, Toshiba ir apstiprinājis, ka viens attēls, kas uzņemts ar komerciāli pieejamu kameru, realizē to pašu attāluma mērīšanas precizitāti, kas nodrošināta ar stereokamerām. Plašāka informācija ir atrodama šajā Toshiba oficiālajā lapā.
Toshiba apstiprinās sistēmas daudzpusību ar komerciāli pieejamām kamerām un objektīviem un paātrinās attēlu apstrādi, lai to publiski ieviestu 2020. finanšu gadā.