Njia Muhimu za Kuchukua
- DALL·E ni mtandao mpya wa neva ambao unaweza kuchora picha kulingana na maandishi.
- Mtandao ni mojawapo ya idadi inayoongezeka ya miradi ya AI ambayo inaweza kuiga matokeo ya ubunifu ya binadamu.
- Wataalamu wanasema picha zilizochorwa na AI sio ubunifu asili.
Sogea huko, Picasso. Mtandao mpya wa neva unaweza kuchora picha kulingana na maandishi.
DALL·E, taswira ya majina ya msanii Salvador Dalí na WALL·E ya Pstrong, inaweza kuchukua maandishi yoyote na kuunda picha kutoka kwayo. Mfumo hutumia mtandao wa neva ambao umefunzwa kwenye mabilioni ya picha na mifano ya maandishi. Ni mojawapo ya idadi inayoongezeka ya miradi ya AI inayoweza kuiga, lakini si kuiga, matokeo ya ubunifu ya binadamu.
"Kwa sababu lugha asilia inabadilika mara kwa mara, na inategemea sana nuances ya kimuktadha, kufundisha mashine kuelewa lugha vizuri vya kutosha kuchora picha ni mafanikio makubwa," Tamara Schwartz, profesa wa usalama wa mtandao katika Chuo cha York cha Pennsylvania., alisema katika mahojiano ya barua pepe. "Fikiria msanii wa mchoro wa polisi, hiyo ni talanta adimu, yenye uwezo wa kuunda picha kulingana na maelezo ya shahidi."
Kutumia Data Kubwa Kutayarisha Picha
DALL-E iliundwa na kampuni ya utafiti ya AI OpenAI na inafanya kazi kwa kukusanya kiasi kikubwa cha data kutoka kwenye mtandao. Data kisha huchakatwa na modeli ya lugha asilia na hufunzwa kutoa picha kutoka kwa maandishi. DALL-E inafanya kazi sawa na GPT-3 iliyotolewa hivi majuzi, modeli ya lugha iliyoundwa na OpenAI ambayo inaweza kuchochewa kutoa vifungu vya maandishi asili. GPT-3 ilifunzwa kwa kutumia maneno nusu trilioni ya maandishi ya mtandaoni na inaweza kutoa maandishi yanayofanana na maisha ya kushangaza.
Kufundisha mashine kuelewa lugha vizuri vya kutosha kuchora picha ni mafanikio makubwa sana.
Michael Yurushkin, mwanzilishi na CTO wa BroutonLab, kampuni ya sayansi ya data, alisema katika mahojiano ya barua pepe kwamba DALL-E ni "mojawapo ya mafanikio machache ya wanadamu katika kuiga ubunifu na mawazo yetu." Aliongeza, "Ni rahisi kutambua jinsi AI inavyotabiri kitu kwa kupitia data muhimu, lakini kuelewa jinsi inavyoweza kutoa michoro kutoka kwa vitu ambavyo haijawahi 'kusikia' kuvihusu hapo awali ni ngumu zaidi."
Schwartz ni mwangalifu kufahamu kuwa AI haiundi taarifa, bali inachukua data ya lugha na kuibadilisha kuwa picha.
"Ubunifu wa awali unatoka kwa mwanadamu aliyeunda kazi," Schwartz alisema. "Kuna `ubunifu' fulani kwa upande wa AI, kwa sababu inafanya majaribio na mchanganyiko mbalimbali wa data na kisha kuchagua kutoka kwa idadi ya matokeo yanayowezekana. Walakini, mwanadamu anakagua matokeo na kufundisha AI jinsi ya kuchagua kutoka kwa mchanganyiko mwingi."
Kazi ya Upelelezi wa Roboti?
Mashine inaweza kufanya majaribio ya mchanganyiko huu wa data na kifaa kwa kasi zaidi kuliko msanii wa kibinadamu. Schwartz alibainisha kuwa DALL-E inaweza siku moja kushirikiana na mpelelezi anayejaribu kuunda upya eneo la uhalifu kupitia mchoro, kulingana na ushuhuda wa mashuhuda.
"Kama mashahidi wanatoa taarifa zao, kompyuta inaweza kuchukua taarifa hiyo ya mazungumzo, ya lugha asilia na kuunda mchoro wa tukio, au michoro mingi ya eneo," alisema. "Taswira hizi zinaweza kisha kuunganishwa ili kuunda taswira sahihi zaidi ya ushahidi uliopotea. Taswira hii inaweza kuboreshwa kwa kuunganisha taswira ya awali ya eneo kabla ya uhalifu."
Programu zingine kadhaa zinazoendeshwa na AI zinaweza kutoa sanaa. Kwa mfano, Ai-Da hutumia mfumo wa mkono wa roboti na teknolojia ya utambuzi wa uso iliyooanishwa na akili ya bandia kuunda sanaa. Mfumo unaweza kuchanganua picha iliyowekwa mbele ya mashine, ambayo huingia kwenye algoriti ili kutoa misogeo ya mkono wa roboti.
Hata hivyo, wasanii wa kibinadamu wasiwe na wasiwasi kwamba wababe wa roboti watachukua nafasi yao, aliteta Ahmed Elgammal, mkurugenzi wa Art and Artificial Intelligence Lab katika Chuo Kikuu cha Rutgers, katika The New York Times mwaka jana.
"Ingawa fasili ya sanaa inazidi kubadilika, katika msingi wake, ni aina ya mawasiliano kati ya wanadamu," aliandika. "Bila msanii wa kibinadamu nyuma ya mashine, AI inaweza kufanya kidogo zaidi ya kucheza na fomu, iwe ina maana ya kudhibiti saizi kwenye skrini au maelezo kwenye leja ya muziki. Shughuli hizi zinaweza kuhusisha na kuvutia kihisia, lakini hazina maana bila mwingiliano kati yao. msanii na hadhira."
Baada ya kutazama kazi ya DALL-E, ninaelewa maoni ya Elgammal kwamba picha zilizoundwa na AI si sanaa. Kwa upande mwingine, ni bora kuliko sanaa yoyote ningeweza kuunda. Kwa hivyo, kwa kweli, ni tofauti gani?