Njia Muhimu za Kuchukua
- Muundo mpya wa kujifunza kwa mashine huleta taswira ya mwonekano wa sentensi katika lugha ili kusaidia tafsiri.
- Mfumo wa AI, unaoitwa VALHALLA, uliundwa ili kuiga jinsi wanadamu wanavyoichukulia lugha.
- Mfumo mpya ni sehemu ya harakati zinazokua za kutumia AI kuelewa lugha.
Mbinu ya kibinadamu ya kuibua picha wakati wa kutafsiri maneno inaweza kusaidia akili ya bandia (AI) kukuelewa vyema zaidi.
Muundo mpya wa kujifunza kwa mashine huleta taswira ya jinsi sentensi inavyoonekana katika lugha. Kulingana na karatasi ya hivi majuzi ya utafiti, mbinu hiyo hutumia taswira na vidokezo vingine kusaidia tafsiri. Ni sehemu ya harakati zinazokua za kutumia AI kuelewa lugha.
"Jinsi watu wanavyozungumza na kuandika ni ya kipekee kwa sababu sote tuna sauti na mitindo tofauti kidogo," Beth Cudney, profesa wa uchanganuzi wa data katika Chuo Kikuu cha Maryville, ambaye hakuhusika katika utafiti huo, aliambia Lifewire katika mahojiano ya barua pepe.. "Kuelewa muktadha ni vigumu kwa sababu ni kama kushughulika na data isiyo na muundo. Hapa ndipo usindikaji wa lugha asilia (NLP) ni muhimu. NLP ni tawi la AI ambalo linashughulikia tofauti za jinsi tunavyowasiliana kwa kutumia ufahamu wa usomaji wa mashine. Tofauti kuu katika NLP, kama tawi la AI, haizingatii tu maana halisi ya maneno tunayozungumza au kuandika. Inaangalia maana."
Nenda Umuulize Alice
Mfumo mpya wa AI, unaoitwa VALHALLA, ulioundwa na watafiti kutoka MIT, IBM, na Chuo Kikuu cha California huko San Diego, uliundwa ili kuiga jinsi wanadamu huchukulia lugha. Kulingana na wanasayansi, kutumia maelezo ya hisia, kama vile media titika, yaliyooanishwa na maneno mapya na yasiyo ya kawaida, kama vile kadibodi zenye picha, huboresha upataji na uhifadhi wa lugha.
Mifumo hii inaongeza nguvu ya chatbots ambazo kwa sasa zimefunzwa pekee na zinaweza kufanya mazungumzo mahususi…
Timu inadai mbinu yao inaboresha usahihi wa tafsiri ya mashine dhidi ya tafsiri ya maandishi pekee. Wanasayansi hao walitumia usanifu wa kisimbaji kisimbaji chenye transfoma mbili, aina ya modeli ya mtandao wa neural inayofaa kwa data tegemezi ya mfuatano, kama lugha, ambayo inaweza kuzingatia maneno muhimu na semantiki ya sentensi. Transfoma moja hutokeza mwonekano wa kuona, na nyingine hufanya tafsiri nyingi kwa kutumia matokeo kutoka kwa kibadilishaji cha kwanza.
"Katika matukio ya ulimwengu halisi, huenda usiwe na picha inayohusiana na sentensi ya chanzo," Rameswar Panda, mmoja wa wanachama wa timu ya utafiti, alisema katika taarifa ya habari. "Kwa hivyo, motisha yetu kimsingi ilikuwa: Badala ya kutumia taswira ya nje wakati wa makisio kama ingizo, je, tunaweza kutumia maono ya macho-uwezo wa kufikiria matukio ya kuona-kuboresha mifumo ya utafsiri wa mashine?"
Uelewa wa AI
Utafiti mkubwa unalenga kuendeleza NLP, Cudney alidokeza. Kwa mfano, Elon Musk alianzisha ushirikiano wa Open AI, ambayo inafanya kazi kwenye GPT-3, muundo unaoweza kuzungumza na binadamu na ni mweledi wa kutosha kutoa msimbo wa programu katika Python na Java.
Google na Meta pia zinafanya kazi kutengeneza AI ya mazungumzo kwa kutumia mfumo wao unaoitwa LAMDA. "Mifumo hii inaongeza nguvu ya chatbots ambazo kwa sasa zimefunzwa tu na zenye uwezo wa mazungumzo maalum, ambayo yatabadilisha sura ya usaidizi wa wateja na madawati ya usaidizi," Cudney alisema.
Aaron Sloman, mwanzilishi mwenza CLIPr, kampuni ya teknolojia ya AI, alisema katika barua pepe kwamba miundo mikubwa ya lugha kama vile GPT-3 inaweza kujifunza kutokana na mifano michache ya mafunzo ili kuboresha muhtasari wa maandishi kulingana na maoni ya binadamu. Kwa mfano, alisema, unaweza kutoa modeli kubwa ya lugha tatizo la hesabu na kuuliza AI ifikirie hatua kwa hatua.
"Tunaweza kutarajia maarifa na hoja zaidi kutolewa kutoka kwa miundo mikubwa ya lugha tunapojifunza zaidi kuhusu uwezo na mapungufu yao," Sloman aliongeza. "Pia ninatarajia miundo hii ya lugha kuunda michakato zaidi inayofanana na ya binadamu huku waundaji wa mitindo wakitengeneza njia bora za kurekebisha miundo kwa ajili ya kazi mahususi zinazowavutia."
Profesa wa kompyuta wa Georgia Tech Diyi Yang alitabiri katika mahojiano ya barua pepe kwamba tutaona matumizi zaidi ya mifumo ya kuchakata lugha asilia (NLP) katika maisha yetu ya kila siku, kuanzia wasaidizi uliobinafsishwa wa NLP ili kusaidia kwa barua pepe na simu, kwa mifumo ya mazungumzo yenye ujuzi kwa ajili ya kutafuta habari katika usafiri au huduma ya afya."Pamoja na mifumo ya haki ya AI ambayo inaweza kufanya kazi na kusaidia wanadamu kwa njia ya kuwajibika na bila upendeleo," Yang aliongeza.
Miundo mikubwa ya AI inayotumia matrilioni ya vigezo kama vile GPT-3 na DeepText itaendelea kufanyia kazi muundo mmoja kwa matumizi yote ya lugha, alitabiri Stephen Hage, mhandisi wa kujifunza mashine katika Dialexa, katika mahojiano ya barua pepe. Alisema pia kutakuwa na aina mpya za miundo itakayoundwa kwa matumizi maalum, kama vile ununuzi wa mtandaoni ulioamriwa na sauti.
"Mfano unaweza kuwa mnunuzi akisema 'Nionyeshe kivuli hiki cha macho katika samawati ya usiku wa manane chenye mwanga mwingi zaidi,' ili kuonyesha kivuli hicho kwenye macho ya mtu huyo kwa udhibiti fulani wa jinsi kinavyowekwa," Hage aliongeza.