Rosa Luxemburgo

From eusterm

Egilea

Maider Arizaleta Alvarez de Eulate

Proiektuaren deskribapena

Abiapuntua eta metodologia

Nire proiekturako abiapuntu gisa, Rosa Luxemburgoren "Erreforma edo Iraultza" testua aukeratu dut; zehazki, lanaren ingelesezko bertsioa ( “Reform or Revolution”: https://www.marxists.org/archive/luxemburg/1900/reform-revolution/ch06.htm ). Lanaren kapituluak “INCEpTION” izeneko aplikazio batean sartu nituen, testuak analizatzeko eta anotazioak egiteko erabiltzen den tresna. Aplikazio horrek aukera ematen dit testuaren termino interesgarriak haren Wikidatako entitateekin lotzeko. Gainera, itzulpena eskaintzeko aukera ere ematen du. Behin termino bat txertatuta, aplikazioak gogoratzen du, eta aurrerago berragertzen bada, terminoa aurrez sartuta egongo da.

Beraz, aurrera eramandako metodologia hurrengoa izan da: lehenik, lan egin behar nuen testu zatiaren euskarazko bertsioa irakurtzea, testuingurua jaso eta terminoak zeri buruzkoak ziren ulertzeko. Behin hori eginda, aplikazioaren barruan, ingelesezko testua irakurtzen hasi, eta aurkitzen nituen termino interesgarriak Wikidatako entitateekin lotzen nituen. Wikidatan entitaterik eduki ezean (askotan gertatzen zen bezala), euskarazko bertsioan ematen duten itzulpena txertatzen nuen.

Zein termino hartu behar diren kontuan eta zein ez, erabaki erabat subjektiboa izan da. Nire ustetan testuaren testuingurua ulertzeko eta ulertzeko zailagoak ziren termino garrantzitsuenak aukeratu ditut; hori izan da muga. Esate baterako, aipatzen diren pertsonen izenak kontuan hartu ditut, orokorrean ezezagunak izan daitezkeelako eta garrantzitsuak direlako, baina ez ditut herrialdeen izenak kontuan hartu, normalean denek ezagutzen dituztelako, eta kasu horietan Wikidatan agertzen den informazioa ez duelako testuaren edukia aberasten eta izen horiek adibideak emateko erabiltzen direlako.

Lanaren progresioa

Hasieran, Rosa Luxemburgoren ingelesezko Wikipediako artikuluan agertzen diren terminoak hartzea erabaki nuen, baina azkenean, beste aukera bat egitea erabaki nuen.

Orduan, “Erreforma edo Iraultza” testua aurkitu nuen euskaraz. Horrekin, “INCEpTION” aplikazioaren bitartez lan egitea erabaki nuen. Bertan, “Reform or Revolution” testua ingelesez irakurri, eta agertzen diren terminoak Wikidatarekin lotu nituen. Wikidatan euskaraz ez dauden terminoak itzuli nituen, euskarazko testua erabiliz. Tresna hau oso erabilgarria da, behin sartzen ditudan terminoak, gero testuan agertzen badira, automatikoki ezagutzen baititu. Osotara, 10 atal daude testuan.

Helburuak

Proiektu honen helburua “Erreforma edo Iraultza” testuaren barneko termino interesgarrienekin hiztegi terminologiko bat sortzea da, ikuspegi digital eta dinamiko batetik. Era honetan egin izateak, aukera ematen dio erabili nahi duenari terminoaren definizioaz gain, testuinguru zabalago bat jasotzeko.

Emaitzak

Osotara, 216 termino identifikatu ditut. Horietatik, X lotu ditut Wikidatarekin, eta X euskaratu ditut.

Proiektu honetan sortutako hiztegi terminologikoak aplikazio anitz izan ditzake. Lehenik eta behin, Rosa Luxemburgoren "Erreforma edo Iraultza" testuaren ulermena errazten du, termino konplexuen inguruko testuinguru osagarria eskainiz. Honek testua sakonago ezagutzeko aukera ematen die irakurleei. Gainera, hiztegi hau abiapuntu izan daiteke etorkizuneko proiektuetarako

Lana bukatuta, ikus daiteke badaudela garrantzitsuak diren termino batzuk Wikidatan sartuta ez daudenak (Wikidatarekin lotu ezin ditudan terminoak, eta beraz, euskarazko itzulpena sartu behar izan dietenak). Bestalde, sartutako terminoekin identifika daitezke euskarazko Wikidatan falta direnak, hauek lexikalizatzeko aukera egongo da. Hainbat kontzeptuek ez dute ez euskarazko terminoa, ez deskribapen laburra, ez wikipedia artikulua; beraz, badakigu bertan hutsune handia dagoela betetzeko.

Zailtasunak

"INCEpTION" plataforma oso erabilgarria izan arren, zailtasun batzuk izan ditut proiektu honetan. Alde batetik, arazo nagusia aplikazioa hitz batzuekin nahastea izan da. Hau da, badaude hitz batzuk berdin idazten direnak, baina kategoria gramatikal desberdinak dituztenak edo testuinguru guztietan esanahi bera ez dutenak. Adibidez, "capitalist" hitza, izen bat ("economic agent that owns or controls the means of producing wealth") edo adjektibo bat ("capitalist society", "capitalist development", etc.) izan daiteke. Edo "state" hitza, "estatu" edo "egoera" esanahiekin.

Beraz, arazoa dator behin hitz bat bere lehen esanahiarekin sartzen duzunean; aplikazioak hitz horiek esanahi horrekin bakarrik hartzen baititu, bereizketarik gabe. Hortaz, kontuz ibili behar izan dut hitzak identifikatzeko eta aldatzeko. Bestalde, "Active learning" tresnak ez ditu desberdin idatzita dauden hitzak identifikatzen; hau da, hitz bat lehen aldiz letra xehez idatzita hartzen baduzu, letra larriz idatzita daudenak ez ditu identifikatuko.

Iturriak (testuak)

“Reform or Revolution” (ingelesez): https://www.marxists.org/archive/luxemburg/1900/reform-revolution/ch06.htmn

“Erreforma edo Iraultza” (euskaraz): https://www.abertzalekomunista.net/images/Liburu_PDF/Internacionales/Luxemburg_Rosa/Erreforma_edo_Iraultza-K.pdf


Rosa Luxemburgo Wikidatan: https://w.wiki/BfKh

Datu-base galdeketak

Anotazioak

Wikidatako entitateak

Galdeketa honek testuan anotatutako Wikidata-entitateak erakusten ditu. Euskarazko baliokiderik ez duten kontzeptuak hasieran agertzen dira, beherago euskarazko baliokidea dutenak, alfabetikoki.

PREFIX euswb: <https://eusterm.wikibase.cloud/entity/>
PREFIX eusdp: <https://eusterm.wikibase.cloud/prop/direct/>

select ?concept ?wikidata_item (sample(?klase) as ?klasea)
?euLabel (group_concat(distinct str(?euAltLabel);SEPARATOR="; ") as ?euAltLabels)
?euDef
?esLabel ?esDef
?enLabel ?enDef
?deLabel ?deDef

where {
  ?concept eusdp:P17 euswb:Q18730. 
  ?concept eusdp:P1 ?wd. bind (iri(concat(str(wd:),?wd)) as ?wikidata_item)
  optional{?concept eusdp:P5 [rdfs:label ?klase]. filter(lang(?klase)="eu")}
  optional{?concept rdfs:label ?euLabel. filter(lang(?euLabel)="eu")}
  optional{?concept skos:altLabel ?euAltLabel. filter(lang(?euAltLabel)="eu")}
  optional{?concept schema:description ?euDef. filter(lang(?euDef)="eu")}
  optional{?concept rdfs:label ?esLabel. filter(lang(?esLabel)="es")}
  optional{?concept schema:description ?esDef. filter(lang(?esDef)="es")}
  optional{?concept rdfs:label ?enLabel. filter(lang(?enLabel)="en")}
  optional{?concept schema:description ?enDef. filter(lang(?enDef)="en")}
  optional{?concept rdfs:label ?deLabel. filter(lang(?deLabel)="de")}
  optional{?concept schema:description ?deDef. filter(lang(?deDef)="de")}
  
 } group by ?concept ?wikidata_item ?klasea ?euLabel ?euAltLabels ?euDef ?esLabel ?esDef ?enLabel ?enDef ?deLabel ?deDef
order by lcase(?euLabel)

Try it!

Wikidatako entitateak eta anotatutako testu-hitzak

Galdeketa honek erakusten du zer hitz edo hitz-multzo zer Wikidata entitaterekin anotatu den, eta zenbat aldiz.

PREFIX euswb: <https://eusterm.wikibase.cloud/entity/>
PREFIX eusdp: <https://eusterm.wikibase.cloud/prop/direct/>
PREFIX eusp: <https://eusterm.wikibase.cloud/prop/>
PREFIX eusps: <https://eusterm.wikibase.cloud/prop/statement/>
PREFIX euspq: <https://eusterm.wikibase.cloud/prop/qualifier/>
PREFIX euspr: <https://eusterm.wikibase.cloud/prop/reference/>
PREFIX eusno: <https://eusterm.wikibase.cloud/prop/novalue/>

select ?concept ?wikidata_item 
?enLabel ?euLabel (group_concat(distinct concat(?testu_hitz, " (", ?kopurua, ")");SEPARATOR="; ") as ?anotazioak)

where {
  ?concept eusdp:P17 euswb:Q18730. 
  ?concept eusdp:P1 ?wd. bind (iri(concat(str(wd:),?wd)) as ?wikidata_item)
  optional{?concept eusdp:P5 [rdfs:label ?klase]. filter(lang(?klase)="eu")}
  optional{?concept rdfs:label ?euLabel. filter(lang(?euLabel)="eu")}
  optional{?concept rdfs:label ?enLabel. filter(lang(?enLabel)="en")}
  ?concept eusp:P171 [eusps:P171 ?testu_hitz; euspq:P172 ?kopurua].
  
 } group by ?concept ?wikidata_item ?enLabel ?euLabel ?anotazioak
order by lcase(?enLabel)

Try it!


Analisiak

Anotatutako entitateen klaseak

Galdeketa honek erakusten du anotatutako entitateek Wikidatan zer klasetakoak diren ("instance of" edo "subclass of")

PREFIX euswb: <https://eusterm.wikibase.cloud/entity/>
PREFIX eusdp: <https://eusterm.wikibase.cloud/prop/direct/>

select ?class ?classLabel (count(distinct ?concept) as ?concepts) (group_concat(distinct(?en_label);SEPARATOR="; ") as ?labels)

where {
  ?concept eusdp:P17 euswb:Q18730. 
  ?concept eusdp:P5|eusdp:P4 ?class; rdfs:label ?en_label. filter(lang(?en_label)="en")
  SERVICE wikibase:label { bd:serviceParam wikibase:language "eu,en,es". }
 } group by ?class ?classLabel ?concepts ?labels
order by desc(?concepts)

Try it!

Wikipedia-artikuluak

Galdeketa honek erakusten du anotatutako entitateei buruzko zenbat hizkuntzatan Wikipedia-artikulurik dagoen.

PREFIX euswb: <https://eusterm.wikibase.cloud/entity/>
PREFIX eusdp: <https://eusterm.wikibase.cloud/prop/direct/>

select ?concept ?conceptLabel ?eu_article ?wikipedia_artikuluak 

where {
  ?concept eusdp:P17 euswb:Q18730; eusdp:P1 ?wd. bind (iri(concat(str(wd:),?wd)) as ?wikidata_item)
  SERVICE <https://query.wikidata.org/sparql> 
          { select ?wikidata_item (count(distinct ?article) as ?wikipedia_artikuluak)
            where {?article schema:about ?wikidata_item. filter(regex(str(?article),"wikipedia"))}
            group by ?wikidata_item ?wikipedia_artikuluak }
  optional{?concept eusdp:P7 ?eu_article. filter(regex(str(?eu_article),"https://eu.wikipedia.org"))}
  SERVICE wikibase:label { bd:serviceParam wikibase:language "eu,en,es". }
 } group by ?concept ?conceptLabel ?eu_article ?wikipedia_artikuluak
order by desc(?wikipedia_artikuluak)

Try it!