Je, Hizi Sauti za AI za Kitabu cha Sauti za Kuvutia Zaidi ni Nzuri au Mbaya?

Orodha ya maudhui:

Je, Hizi Sauti za AI za Kitabu cha Sauti za Kuvutia Zaidi ni Nzuri au Mbaya?
Je, Hizi Sauti za AI za Kitabu cha Sauti za Kuvutia Zaidi ni Nzuri au Mbaya?
Anonim

Njia Muhimu za Kuchukua

  • DeepZen hutumia AI (akili bandia) kuunda vitabu vya sauti vya kushangaza kutoka kwa maandishi.
  • Teknolojia hutumia waigizaji halisi wa sauti ya binadamu kutoa vizuizi vya ujenzi.
  • Amazon na Audible kwa sasa hazikubali vitabu vya sauti vinavyozalishwa na kompyuta.
Image
Image

DeepZen ni kampuni inayounda sauti za kompyuta zinazotumiwa katika vitabu vya sauti, kulingana na sauti halisi za waigizaji wa kibinadamu. Ubora ni wa kutisha-ni mzuri vya kutosha kusikiliza kwa saa kwa wakati mmoja. Ujanja hapa ni kipengele cha AI (akili bandia), ambacho kinaweza kusoma maandishi na kukisia jibu sahihi la kihisia kulingana na muktadha. Kisha inaweka hisia hiyo kwenye sauti.

Inavutia na inafaa sana. Lakini je, kweli tunataka matumizi ya kitabu cha sauti kilichosawazishwa? Na vipi kuhusu waigizaji hao wa sauti?

"Kwa mtazamo wa mchapishaji wa indie, chochote kinachopunguza gharama ya utengenezaji wa vitabu vya sauti kinapendeza sana," Rick Carlile, mmiliki wa mchapishaji wa kujitegemea Carlile Media, aliiambia Lifewire kupitia barua pepe.

"Lakini kivutio hicho kinadhania kuwa bidhaa hiyo itakuwa ya ubora sawa na simulizi za kimapokeo. Sidhani kama bado tuko hapo kwa asilimia mia moja. Usinielewe vibaya, DeepZen ni nzuri sana. Ni nzuri sana. mafanikio makubwa, na waundaji wake wanastahili sifa na mafanikio makubwa. Lakini bado haijakamilika."

Sauti Hiyo 'Nzuri ya Kutosha'

Njia bora ya kuelewa ubora wa DeepZen ni kusikiliza sampuli. Ikiwa hukujua kuwa yametolewa na kompyuta, unaweza hata usitambue. Sio kwa muda hata hivyo. Hebu tuchukulie kwamba AI ya DeepZen ni kamili na kwamba haifasiri kimakosa madokezo ya hisia ambayo inapaswa kugonga.

Image
Image

Hata hivyo, mwanadamu anaweza kutoa tafsiri zenye utata zaidi na mara nyingi za kushangaza zaidi. Muigizaji anaweza kuweka mabadiliko yasiyotarajiwa kwa maneno ambayo kompyuta haitawahi kufikiria. Na kwa uhalisia, tafsiri ya AI hakika bado si nzuri kama ile ya mwigizaji mtaalamu wa sauti.

"Kama mtu anayefanya kazi kwenye filamu na hivi majuzi katika ulimwengu wa simulizi za sauti, huku nikivutiwa na AI-najua kwa hakika kwamba kuna maana ya kina ambayo mashine haiwezi kutafsiri," sauti ya kitaaluma. mwigizaji Paul Cram aliiambia Lifewire kupitia barua pepe.

"Je, kutakuwa na ongezeko la waandishi wasiojulikana watakaoitumia? Ninakuhakikishia wataitumia kwa sababu 'inatosha.'"

Kuwa mzuri vya kutosha, pamoja na urahisi na uokoaji wa gharama, kunaweza kutosha kuwapeleka wachapishaji wa indie kwenye huduma.

"Vitabu vya kusikiliza vinaweza kugharimu hadi $500 kwa saa iliyokamilika ya sauti (zaidi zaidi kwa sauti ya watu mashuhuri), na hiyo haijumuishi gharama ya muda ya usimamizi na msimamizi," anasema Carlile. "Kuweza kupunguza gharama hiyo kwa nusu kwa kupakia muswada kwa mtoa huduma kama vile DeepZen kunavutia sana."

Tatizo la Kuzungumza

Bado si rahisi kama kuwarusha waigizaji wako wa sauti na kupakia miswada kwenye DeepZen. Kwa sasa kuna kikwazo kimoja kwa uwasilishaji rahisi wa kitabu cha sauti cha AI, na kinatoka Amazon.

Image
Image

"Kwa sasa, ACX, njia ya mchapishaji binafsi hadi usambazaji wa vitabu vya sauti vya Audible na Amazon, haitakubali vitabu vya sauti ambavyo binadamu hakurekodi," anasema Carlile.

Kwanini? Ubora. Hili hapa ni ingizo la Maswali Yanayoulizwa Mara kwa Mara kutoka kwa tovuti:

"Maandishi hadi usemi au rekodi nyingine za kiotomatiki haziruhusiwi. Wasikilizaji wanaosikika huchagua vitabu vya sauti kwa ajili ya utendakazi wa nyenzo, pamoja na hadithi. Ili kukidhi matarajio hayo, kitabu chako cha kusikiliza lazima kirekodiwe na mwanadamu."

Hii inamaanisha kuwa vitabu vya kusikiliza vinavyotengenezwa na DeepZen havipo kwa sasa, angalau. Huu ni uvumi mtupu, lakini DeepZen ingeonekana kama upataji mzuri sana kwa Amazon, ikiiruhusu kuuza huduma na kuiweka kwa vitabu vinavyosikika pekee. Na hata kama hilo halifanyiki, ikiwa ubora wa vitabu vya sauti vinavyozalishwa na kompyuta ni mzuri kama hivi, basi inaonekana kuna sababu ndogo ya kutofanya ubaguzi kwa sheria hii.

Utafurahi kusikiliza vitabu vya sauti vilivyoundwa hivi? Inapotokea, watu wengi hata hawatashuku. Wengine wanaweza kupendelea ukamilifu wa sauti zinazozalishwa na kompyuta kwa sababu hawatakuwa na tiki na mazoea ambayo wakati mwingine yanaweza kuvuruga. Teknolojia hiyo pia inafaa kwa michezo ya video, matangazo ya TV na redio, na hali nyingine yoyote ambapo ungeajiri mwigizaji wa sauti.

Teknolojia ya DeepZen pia inaweza kutengeneza njia nzuri ya kuunda kiotomatiki podikasti za habari kutoka kwa makala zilizoandikwa, ambazo zinaweza kusaidia kwa usafiri.

Na vipi kuhusu waigizaji hao wa sauti? Vema, kutakuwa na angalau fursa moja: Wanaweza kwenda na kufanya kazi kwa DeepZen.

Ilipendekeza: