Njia Muhimu za Kuchukua
- Nvidia hivi majuzi alionyesha mbinu inayogeuza picha za 2D kuwa matukio ya 3D kwa sekunde chache.
- Njia hii hutumia nishati ya kompyuta kukadiria jinsi mwanga hufanya kazi katika ulimwengu halisi.
- Metaverse ni eneo moja ambapo matukio ya 3D ni muhimu kwa sababu yanaweza kutazamwa kutoka kwa mtazamo wowote wa kamera.
Teknolojia mpya ya akili bandia (AI) kutoka Nvidia inaweza hivi karibuni kugeuza picha za 2D kuwa matukio ya 3D katika sekunde chache, na kufanya uundaji wa nafasi za mtandaoni za kina kama vile metaverse kuwa jambo dogo kama usindikaji wa maneno.
Nvidia hivi majuzi alionyesha mbinu ya picha inayoitwa Instant NeRF, ambayo hutumia nguvu ya kompyuta kukadiria jinsi mwanga unavyofanya kazi katika ulimwengu halisi. Inaweza kubadilisha picha zako za zamani kuwa eneo la mchezo wa video, au inaweza kutumika kufunza roboti na magari yanayojiendesha ili kuelewa ukubwa na umbo la vitu vya ulimwengu halisi.
"Upigaji picha wa 3D huleta ulimwengu mpya wa mabadiliko," Oren Debbi, Mkurugenzi Mtendaji wa Visionary.ai, kampuni ya maono ya kompyuta inayoendesha algoriti zake za 3D kwenye jukwaa la Nvidia, aliiambia Lifewire katika mahojiano ya barua pepe. "Kwa kutumia 3D, unaiga kina cha ulimwengu halisi kwenye eneo na kufanya picha ionekane hai na ya kweli zaidi. Kando na AR/VR na kamera za viwandani, ambapo 3D ni ya kawaida sana, sasa tunaiona ikitumika kwenye karibu kila simu mahiri bila mtumiaji hata kujua."
Kuongeza Vipimo
Picha ya kwanza papo hapo, iliyopigwa miaka 75 iliyopita kwa kamera ya Polaroid, iliyolenga kunasa ulimwengu wa 3D katika picha ya 2D kwa haraka. Sasa, watafiti wa AI wanafanyia kazi kinyume: kugeuza mkusanyiko wa picha tulizo kuwa onyesho dijitali la 3D kwa sekunde.
Inayojulikana kama uwasilishaji kinyume, mchakato hutumia AI kukadiria jinsi mwanga hutenda katika ulimwengu halisi, kuwezesha watafiti kuunda upya tukio la 3D kutoka kwa picha chache za 2D zilizopigwa kwa pembe tofauti. Nvidia anadai kuwa imebuni mbinu ambayo inatimiza kazi hii karibu mara moja.
Nvidia alitumia mbinu hii na teknolojia mpya iitwayo neural radiance fields, au NeRF. Kampuni hiyo inasema matokeo, yaliyopewa jina la Instant NeRF, ndiyo mbinu ya haraka zaidi ya NeRF hadi sasa. Muundo huo unahitaji sekunde chache tu kufanya mazoezi kwenye picha kadhaa tuli na kisha unaweza kutoa mandhari ya 3D inayotokana ndani ya makumi ya milisekunde.
"Iwapo uwakilishi wa kitamaduni wa 3D kama vile wavu poligonal ni sawa na picha za vekta, NeRF ni kama picha za bitmap: hunasa kwa wingi jinsi mwanga unavyotoka kwa kitu au ndani ya tukio," David Luebke, makamu wa rais wa utafiti wa michoro katika Nvidia, alisema katika taarifa ya habari: "Kwa maana hiyo, NeRF ya Papo hapo inaweza kuwa muhimu kwa 3D kama vile kamera za dijiti na ukandamizaji wa JPEG umekuwa kwa upigaji picha wa 2D-na kuongeza kasi, urahisi na ufikiaji wa kunasa na kushiriki 3D.”
Kukusanya data ili kulisha NeRF kunahitaji mtandao wa neva kukamata picha kadhaa zilizopigwa kutoka sehemu mbalimbali kuzunguka eneo la tukio, pamoja na mkao wa kamera wa kila moja ya picha hizo.
NeRF hufunza mtandao mdogo wa neva ili kuunda upya tukio kwa kutabiri rangi ya mwanga inayoangaza upande wowote, kutoka sehemu yoyote katika nafasi ya 3D.
Rufaa ya 3D
Metaverse ni eneo moja ambapo matukio ya 3D ni muhimu kwa sababu yanaweza kutazamwa kutoka kwa mtazamo wowote wa kamera, Brad Quinton, mwanzilishi wa Perceptus Platform for augmented reality (AR), aliiambia Lifewire katika mahojiano ya barua pepe. Kama vile tu tunaweza kutembea katika chumba katika maisha halisi na kuona yaliyomo kutoka pembe nyingi tofauti, kwa onyesho lililoundwa upya la 3D, tunaweza kwa kweli kupitia nafasi na kuiona kwa mtazamo wowote.
"Hii inaweza kuwa muhimu hasa kwa kuunda mazingira ya matumizi katika uhalisia pepe," Quinton alisema.
Programu kama vile Apple's Object Capture hutumia mbinu inayoitwa photogrammetry kuunda vitu pepe vya 3D kutoka kwa mfululizo wa picha za 2D. Miundo ya 3D itatumika sana katika uhalisia pepe na programu za Uhalisia Pepe, Quinton alitabiri. Kwa mfano, baadhi ya AI, kama ile iliyo kwenye Perceptus AR Platform, hutumia miundo ya 3D ili kuunda uelewaji wa ulimwengu halisi, unaoruhusu programu za Uhalisia Ulioboreshwa kwa wakati halisi.
Matumizi ya picha za 3D pia huiga kina cha ulimwengu halisi katika tukio na kufanya picha ionekane hai na ya kweli, Debbi alisema. Ili kuunda athari ya Bokeh (hali ya picha inayojulikana kama hali ya sinema), uchoraji wa ramani wa kina wa 3D ni muhimu. Mbinu hii hutumiwa kwenye takriban kila simu mahiri.
"Hiki tayari ndicho kiwango cha wapiga picha wa video kitaalamu wanaorekodi filamu, na hiki kinakuwa kiwango cha kawaida kwa kila mtumiaji," Debbi aliongeza.