Mazungumzo na Kompyuta yako Huenda yakapata Uhalisia Zaidi

Orodha ya maudhui:

Mazungumzo na Kompyuta yako Huenda yakapata Uhalisia Zaidi
Mazungumzo na Kompyuta yako Huenda yakapata Uhalisia Zaidi
Anonim

Njia Muhimu za Kuchukua

  • Meta inatumia AI kutengeneza programu zinazoweza kueleza hisia katika usemi.
  • Timu ya AI ya kampuni hiyo imesema kuwa imepiga hatua katika kuiga sauti zinazoeleweka, kama vile vicheko, kupiga miayo, vilio na "kupiga soga moja kwa moja" katika muda halisi.
  • AI pia inatumiwa kuimarisha uboreshaji wa utambuzi wa usemi.
Image
Image

Hivi karibuni unaweza kuwa na gumzo la kawaida zaidi na kompyuta yako, kutokana na uwezo wa akili bandia (AI).

Meta imesema kuwa imepata maendeleo makubwa katika juhudi zake za kuunda mifumo ya kweli zaidi ya matamshi inayozalishwa na AI. Timu ya AI ya kampuni hiyo ilisema imepiga hatua katika uwezo wa kuiga sauti zinazoeleweka, kama vile kicheko, kupiga miayo na vilio, pamoja na "kupiga soga moja kwa moja" katika muda halisi.

"Katika mazungumzo yoyote mahususi, watu hubadilishana ishara zisizo za maneno, kama vile lafudhi, usemi wa hisia, kusitisha, lafudhi, midundo-yote ambayo ni muhimu kwa mwingiliano wa binadamu," timu iliandika katika chapisho la hivi majuzi la blogu.. "Lakini mifumo ya kisasa ya AI inashindwa kunasa ishara hizi tajiri na za kujieleza kwa sababu zinajifunza kutoka kwa maandishi tu, ambayo yananasa kile tunachosema lakini sio jinsi tunavyosema."

Mazungumzo Mahiri

Katika chapisho la blogu, timu ya Meta AI ilisema inajitahidi kushinda vikwazo vya mifumo ya kitamaduni ya AI ambayo haiwezi kuelewa ishara zisizo za maongezi katika hotuba, kama vile viimbo, misemo ya hisia, kusitisha, lafudhi na midundo.. Mifumo imezuiwa kwa sababu inaweza kujifunza kutoka kwa maandishi pekee.

Lakini kazi ya Meta ni tofauti na juhudi za awali kwa sababu miundo yake ya AI inaweza kutumia miundo ya kuchakata lugha asilia ili kunasa hali kamili ya lugha inayozungumzwa. Watafiti wa Meta wanasema kwamba miundo mipya inaweza kuruhusu mifumo ya AI kuwasilisha hisia inayotaka kuwasilisha-kama vile kuchoshwa au kejeli.

"Katika siku za usoni, tutaangazia kutumia mbinu zisizo na maandishi ili kuunda programu muhimu za mkondo bila kuhitaji lebo za maandishi zinazotumia rasilimali nyingi au mifumo otomatiki ya utambuzi wa usemi (ASR), kama vile kujibu maswali (k.m., "Je! hali ya hewa?"), "timu iliandika kwenye chapisho la blogi. "Tunaamini prosody katika hotuba inaweza kusaidia kuchanganua sentensi vizuri zaidi, ambayo hurahisisha kuelewa dhamira na kuboresha utendakazi wa kujibu maswali."

AI Powers Comprehension

Sio tu kwamba kompyuta zinaboreka katika kuwasiliana maana, lakini AI pia inatumiwa kuimarisha uboreshaji wa utambuzi wa usemi.

Wanasayansi wa kompyuta wamekuwa wakifanya kazi ya utambuzi wa usemi wa kompyuta tangu angalau 1952, wakati watafiti watatu wa Bell Labs walipounda mfumo ambao unaweza kutambua tarakimu moja, afisa mkuu wa teknolojia wa AI Dynamics, Ryan Monsurate, alisema katika barua pepe kwa Lifewire. Kufikia miaka ya 1990, mifumo ya utambuzi wa usemi ilikuwa inapatikana kibiashara lakini bado ilikuwa na kiwango cha makosa ambacho kilikuwa cha juu vya kutosha kukatisha matumizi nje ya vikoa maalum vya matumizi kama vile huduma ya afya.

"Kwa kuwa sasa miundo ya kina ya kujifunza imewezesha miundo ya pamoja (kama ile ya Microsoft) kufikia utendaji wa juu zaidi wa ubinadamu katika utambuzi wa usemi, tuna teknolojia ya kuwezesha mawasiliano ya maongezi yasiyotegemea mzungumzaji na kompyuta kwa kiwango kikubwa," Monsurate alisema. "Hatua inayofuata itajumuisha kupunguza gharama ili kila mtu anayetumia Siri au visaidizi vya Google AI apate ufikiaji wa kiwango hiki cha utambuzi wa usemi."

Image
Image

AI ni muhimu kwa utambuzi wa matamshi kwa sababu inaweza kuboreshwa baada ya muda kupitia kujifunza, Ariel Utnik, afisa mkuu wa mapato na meneja mkuu katika kampuni ya sauti ya AI Verbit.ai, aliiambia Lifewire katika mahojiano ya barua pepe. Kwa mfano, Verbit inadai teknolojia yake ya ndani ya AI hutambua na kuchuja kelele ya chinichini na mwangwi na kunakili spika bila kujali lafu ili kutoa manukuu ya kina, ya kitaalamu kutoka kwa video na sauti iliyorekodiwa na ya moja kwa moja na iliyorekodiwa.

Lakini Utnik alisema kuwa mifumo mingi ya sasa ya utambuzi wa usemi ni sahihi kwa asilimia 75-80 pekee.

"AI haitawahi kuchukua nafasi ya binadamu kikamilifu kwani ukaguzi wa kibinafsi wa wanakili, wasahihishaji na wahariri ni muhimu ili kuhakikisha manukuu ya mwisho ya ubora wa juu na usahihi wa hali ya juu," aliongeza.

Utambuaji bora wa sauti pia unaweza kutumika kuzuia wadukuzi, Sanjay Gupta, makamu wa rais mkuu wa bidhaa na maendeleo ya shirika katika kampuni ya utambuzi wa sauti ya Mitek Systems, alisema katika barua pepe. Utafiti unaonyesha kuwa ndani ya miaka miwili, asilimia 20 ya mashambulizi yote ya uchukuaji akaunti yaliyofaulu yatatumia uboreshaji wa sauti sintetiki, aliongeza.

"Hii inamaanisha kadiri teknolojia ya kina ghushi inavyozidi kuwa ya kisasa zaidi, tunahitaji wakati huo huo kuunda usalama wa hali ya juu ambao unaweza kukabiliana na mbinu hizi pamoja na picha na video ghushi," Gupta alisema. "Kupambana na upotoshaji wa sauti kunahitaji teknolojia ya kutambua uhai, yenye uwezo wa kutofautisha kati ya sauti ya moja kwa moja na toleo la sauti lililorekodiwa, la syntetisk au linalozalishwa na kompyuta."

Sahihisho 2022-05-04: Imesahihisha tahajia ya jina la Ryan Monsurate katika aya ya 9.

Ilipendekeza: