Ĉifromono rapidigas parolrekonon en Esperanto

Ĉiam pli ofte homoj parolas ne per siaj poŝtelefonoj, sed al la telefonoj. En Esperanto tio ankoraŭ ne eblas, ĉar mankas parolrekonaj programoj. Sed nun la evoluigo okazas multe pli rapide, ĉar donacita ĉifromono logas pliajn volontulojn, kiuj voĉlegas frazojn en Esperanto.

Jam en 2018 la usona entrepreno Lionbridge petis helpon de Universala Esperanto-Asocio por trovi helpantojn kiuj povas voĉlegi frazojn en Esperanto. Tiam oni supozis, ke la mendinto povas esti Google, kiu volas plibonigi sian voĉrekonan sistemon kaj eble aldoni Esperanton inter la uzeblaj lingvoj.

Iam en 2019 la sama entrepreno planis denove varbi esperantistojn por registri pliajn voĉdatumojn, sed jam en frua etapo venis informo, ke la projekto estas provizore haltigita. Poste UEA ne plu estis kontaktita.

Ĝis nun nenio plia aŭdiĝis de tiu projekto, sed samtempe, en 2018, estis lanĉita ankaŭ alia kolektado de Esperantaj voĉoj. Temas pri la datumaro de la nekomerca komputa fondaĵo Mozilla kadre de la projekto Common Voice (Komuna Voĉo – KV).

La unua datumaro de KV kun pli ol unu gigabajto de registritaj voĉoj en Esperanto estis publikigita en januaro 2020, kun entute 41 horoj da registraĵoj, el kiuj 35 horoj jam estis kontrolitaj kaj aprobitaj de la kunlaborantoj de la projekto.

Tio estas tro malmulte por ajnaj praktikaj uzoj, kaj la volontula kolektado progresis malrapide. Tamen ekde januaro 2021 la afero akceliĝis, kiam esperantistaj uzantoj de la ĉifromono Miriado decidis stimuli la projekton per transpagoj al voĉlegantoj.

Stefan Grotz.

Stefan Grotz, unu el la ĉefaj kontribuantoj de la Esperanta sekcio, ĝojas pro la aliĝo de ĉifromona grupo:

– La tuta projekto ege ŝanĝiĝis kiam la nova grupo komencis subteni la projekton per Miriado. Ni kolektis 100 horojn en la unuaj du jaroj, kaj en la tempo inter januaro kaj nun ni atingis 500 aldonajn horojn nur dank’ al la novaj subtenantoj.

Multaj el la novaj voĉlegantoj, logataj de ĉifromono, venas el Venezuelo kaj Burundo, kaj ne ĉiuj estas ege spertaj esperantistoj. Tio laŭ Stefan Grotz tamen ne estas grava problemo.

– Nu, la kvalito de la kontribuoj iomete malaltiĝis, sed ĉiu kontribuo estas kontrolita de minimume du aliaj personoj, do la rezulto verŝajne restas bona. Ankaŭ laŭ mia scio la teamo nun havas pli striktan sistemon por elekti voĉojn kiuj ricevas la ĉifrovaluton. Parenteze: Havi pli da afrikaj kaj sudamerikaj akĉentoj en la datumaro certe estas bona kaj grava afero.

Ja daŭre mankas virinaj voĉoj, sed tio momente ne bezonas esti problemo, laŭ Stefan Grotz:

– Ni unue volas krei sistemon kiu funkcias iel ajn, kaj poste oni povas analizi, kio en la sistemo ne bone funkcias. Sed pli da diverseco ĉiam bonas, kaj ni vere volas krei sistemon kiu bone funkcias por ĉiu uzanto. Tial ni vere ĝojus pri pli da inaj kontribuantoj, sed ankaŭ pri ĉiuj akĉentoj kaj ĉiuj aĝoj.

Esperanto nun estas unu el la grandaj lingvoj en Komuna Voĉo, kaj kun la novaj voĉoj eblos iom post iom grave plibonigi la funkciadon de Deepspeech, la parolrekona sistemo de Mozilla, por Esperanto.

La kresko de la registraĵoj en Esperanto okazis ĉefe dum la lastaj monatoj.

– Kontaktis min Tim, germana studento el Berlino. Ni kune kreis testan sistemon kun la 90 horoj de la datumaro de decembro 2020. Kun la 90 horoj da voĉoj, la sistemo havas eraroftecon de proksimume 50 elcentoj. Do ĉiu dua vorto estas ĝuste rekonita. Mi esperas, ke sistemo trejnita kun 600 horoj estos ege pli bona

La novan sistemon oni komence volas uzi por aŭtomate krei subtekstojn por videoj. La unua versio bazita sur 90 horoj da voĉoj estis jam elprovita kun la podkasto pri hejma aŭtomatigo. La proponataj tekstoj estas foje kompreneblaj, foje nur amuzaj:

Sed estas la epizodo pri certe la afero pri kiu mi neniam pensis ke mi jam interesigas kavalireca s ne estas matenmanga cifera koncesion kien ni dum jaroj eksciis pri la tempo per prevente bela edzebleco sia bazigas abe…

Efektive la parolisto diris:

Estas la epizodo pri… pri la afero pri kiu mi neniam pensis ke mi tiom interesiĝos kaj mi pensas ke estos iomete malfacile rakonti ĉion kion mi dum jaroj eksciis pri la temo kaj plej verŝajne de… la tuta epizodo estos iomete kaosa…

Do, restas spaco por plibonigo. Sed iom post iom komputiloj kun helpo de esperantistoj ja lernos kompreni parolatan Esperanton. Tamen tio ne nepre signifos, ke eblos paroli Esperanton al ajna poŝtelefono.

Apple ĝis nun ne aldonis eĉ Esperantan klavaron al siaj poŝtelefonoj, do apenaŭ kredeblas, ke Iphone baldaŭ ekkomprenus Esperanton. Google jam de jaroj multe pli favore sintenas al Esperanto, kun tradukilo kaj klavaro por Android, sed la operaciumo Android ne haveblas en Esperanto.

– Mi ne konas la planojn de grandaj firmaoj, sed Google almenaŭ jam subtenas Esperanton en aliaj kampoj, kaj mi pensas ke eble iam ili subtenos la lingvon. Tiam ili verŝajne ankaŭ uzos la datumaron de Common Voice kaj siajn proprajn datumarojn, diras Stefan Grotz.

Pli realisma celo laŭ li estas uzi liberan programaron:

–  Komuna Voĉo estas granda projekto, tial ni povas profiti de la laboro de alilingvaj programistoj. Ekzemple la libera videa redaktilo Kdenlive subtenas aŭtomatan kreadon de subtekstoj, kaj ni planas aldoni Esperanton. Anstataŭ ”Hej Guglo” aŭ “Aleksa” ni eble pli frue diros “Hej Mycroft”. Mycroft estas libera voĉa asistanto. La celo de la projekto ĉefe estas ebligi la kreadon de tiaj softvaroj. Tial ni certe ankaŭ bezonos la kreemon de aliaj programistoj se ni volas krei pli mojosajn aplikaĵojn ol nur ilon por krei subtekstojn.


Pli pri la temo:

13 Komentoj
plej malnova
plej nova plej populara
Entekstaj komentoj
Vidu ĉiujn komentojn
Pablo
2021-06-29 8:43

Multaj avantagxoj donas tiun projekton.

Gxi helpos ke blinduloj povos uzi komputilon kaj posxtelefonon en Esperanto, gxi permesos fari auxtomatajn subtekstojn de filmoj.

Aldone al tio, la datumbazo estos libera, tio signifas ke se teknologio disvolvigxas, eblos uzi la datumbazon por disvolvigi nova vocxrekonilon.

Kaj alia aldono, gxi estas unu el la lingoj kun pi da kunlaborajxoj, kaj tio videbligas esperanto al homoj kiuj ne scias, aux ne interesas pri esperanto.

Pablo
2021-06-29 8:47

Antaŭ monatoj mi faris jenan filmeton (muzika kolaĝo) por helpi diskonigi komunan voĉon inter esperantistoj, kaj Esperanton inter interesatoj pri komuna voĉo:

https://tubaro.aperu.net/v/ytb_hYAi0ukbfkk/

Pablo
2021-06-29 8:50
Respondo al  Pablo

Kurioze, mi faris alian komenton, kaj ĝi atendas aprobon de administrantoj, sed ne ĉiu tiu.

Klaus Leith
2021-06-29 12:57
Respondo al  Pablo

Se via komento enhavas nur unu ligilon, ĝi estas akceptata sen antaŭa aprobo.

Pablo
2021-06-29 15:40
Respondo al  Klaus Leith

Ho! Ĉu ĝi devas havi ligilon por esti aŭtomate aprobita, sed sen ligilo ĝi devas atendi? Kurioze,

Dankon

Kalle Kniivilä
2021-06-29 16:10
Respondo al  Pablo

Ne. Se estas pli ol unu ligilo, necesas aprobo. Se estas maksimume unu ligilo, kutime ne necesas aprobo. Tamen la unua komento de nova komentanto ĉiam devas esti aprobita.

Gilbert 1919
Gilbert 1919
2021-06-29 9:04

La ĉifromono miriado kontribuas al diskonigo de Esperanto. Ni esperas ke la projekto plu daŭros, estus bone se aliaj esperantistoj interesiĝus al la projekto. Estas la plej taŭga vojo atingi venkon, kiun Zamenhof diris

Neil
Neil
2021-06-29 10:53

Daŭre uzi ĉifromonon konsciante pri la ekologia kosto dum la nuntempa ekologia krizo estas malmorale. Oni pretendas ke ĝi estas la sola maniero por ĝiri monon al homoj en Afriko, sed laŭ mia sperto ŝajnas ankoraŭ tre malfacile por afrikanoj konverti la ĉifromonon al uzebla mono, do ĝi ne ŝajnas bona solvo. Denove ŝajnas pli ke temas pri ĉifromonobsedatoj kiuj serĉas pretekston por uzi ĉifromonon anstataŭ ke ili havis problemon kaj trovis ĉifromonon por solvi ĝin. Mi ne pensas ke ligi la esperanto-movadon al ĉifromono estas bona ideo.

Pablo
2021-06-29 11:23
Respondo al  Neil

Eble, sed ja realo estas ke nur per tiu kuniĝo de interesoj la afero progresiĝis el esti minoritata lingvo al esti la 6a lingvo kun pli da kunlaboraĵoj.

Parenteze, ne ĉiuj ĉifromonoj estas egalaj el energia uzado

Neil
Neil
2021-06-29 11:38
Respondo al  Pablo

Laŭ mia kompreno Miriado ne estas inter la ĉifromonoj kiuj provas solvi la problemon de energikonsumado. Ĝi daŭre uzas “pruvon de laboro” (t.e. “pruvo de energimalŝparo”).

La projekto progresas ĉar oni donas monon al ĝi, ne aparte ĉar la mono estas ĉifra. Misuzi tion por propagandi ĉifromonon estas kvazaŭ subaĉetado.

Breanna Wilder
Breanna Wilder
2021-06-29 12:49
Respondo al  Neil

Kritikante la energikoston de iu sistemo, oni devas kompari ĝin kun la energikosto de la alternativoj. Ĉu vi scias la koston de la nuntempe hegemonia financa sistemo? Bankoj estas la plej granda industrio tutmonde. Ĉiujare ili pagas monpunon al registaroj ĉar ili lavas monon por danĝeraj krimsindikatoj. Ili ne havas moralojn por zorgi pri ekologiaj aferoj.

Pri ĉifromonoj kiuj uzas supozeble pli energiŝparajn alternativojn ol “laborpruvo,” mankas ankoraŭ pruvo ke ili funkcias kaj estas daŭrigeblaj. “Laborpruvo” nun estas pruvita koncepto. Ĉifromonoj evoluas. Se nova koncepto pruvas sin, ĉifromonoj povas adopti ĝin.

Yves Bellefeuille
Yves Bellefeuille
2021-06-29 23:30

Estus pli amuze uzi Moneron, kiu ja estas esperanta vorto.

dieter rooke
2021-06-30 10:12

Mia komputilo ” sribotabla ” ne kapablas uzi la vochrekonan programon .