Corpus (corpora) — latīņu vārds 'ķermenis': nozīmes un lietojums

Corpus (corpora) — latīņu vārds "ķermenis": skaidrojums, nozīmes un lietojums gramatikā, medicīnā un tiesībās. Uzzini piemērus, izcelsmi un kontekstus.

Autors: Leandro Alegsa

Corpus (daudzskaitlī corpora) latīņu valodā nozīmē ķermenis. Tas var nozīmēt:

Galvenās nozīmes un lietojumi

  • Ķermenis, fiziska masa — vispārīgā nozīmē corpus apzīmē dzīvu vai nedzīvu ķermeni, tā struktūru. Šī pamatnozīme ir avots daudzām atvasinātām nozīmēm mūsdienu valodās.
  • Juridiskā un tiesiskā lietojuma vārdi — latīņu frāzes, kas satur corpus, bieži sastopamas tiesību terminoloģijā: piemēram, habeas corpus (tiesības neatrasties aizturējumā bez tiesas lēmuma), corpus delicti (pierādījums par nozieguma esamību) un corpus juris (tiesību kopums).
  • Reliģiskā nozīme — frāze Corpus Christi nozīmē “Kristus ķermenis” un ir katoļu baznīcas svētku nosaukums, kas saistīts ar Svēto Komūniju.
  • Tekstu un datu kolekcija — korpuss (corpus) — modernā zinātnē un informācijas tehnoloģijās corpus nozīmē sistemātisku tekstu vai datu kopu, ko izmanto pētījumiem, statistikai vai mašīnmācībai. Šie korpusi var būt:
    • lingvistiski tekstkorpusi (piem., nacionālie vai valodas korpusi, paralēlie korpusi tulkošanas pētījumiem);
    • annotēti korpusi (teksti ar morfoloģiskiem, sintaktiskiem vai semantiskajiem tagiem);
    • korpusi mašīnmācībai — teksta, attēlu vai audio datu kopas, kuras izmanto modeļu apmācībai.
  • Literatūras vai darbu kopums — var attiekties uz kāda autora darbu kopumu vai akadēmisku apkopojumu, piemēram, “corpus” nozīmē publicēto rakstu, dokumentu vai manuskriptu komplektu.
  • Tehniskais un inženiertehniskais lietojums — mūsdienu valodās radās atvasinājumi kā korpuss (piem., datora korpuss, mēbeļu korpuss), kas nozīmē ierīces vai priekšmeta ārējo ietvaru vai korpusu.

Lingvistisko korpusu detaļas

  • Sinhronisks vs diahronisks — sinhroniskais korpuss aptver valodas stāvokli noteiktā laikā, diahronisks — valodas izmaiņas laika gaitā.
  • Monolingvālie un paralēlie korpusi — monolingvāls satur tekstus vienā valodā; paralēls satur tekstus un to tulkojumus vairākās valodās, noderīgs tulkošanas pētījumiem un mašīntulkošanai.
  • Annotācija — korpusi bieži tiek atzīmēti ar morfoloģiskām, sintaktiskām vai semantiskām kategorijām, kas ļauj veikt precīzāku automātisku un manuālu analīzi.
  • Instrumenti un metodes — darbam ar korpusiem izmanto konkordancerus, frekvenču analīzes rīkus, N-gramu analīzi un modernas NLP bibliotēkas.

Padomi lietošanai un piemēri

  • Dažādās nozarēs vārds tiek adaptēts un lokalizēts — latviešu valodā bieži lieto korpuss tehniskos vai ikdienišķos kontekstos, bet akadēmiskajā terminoloģijā saglabā anglicismu corpus/corpora.
  • Piemēri: Latviešu valodas korpuss (valodas pētniecībai), British National Corpus (BNC) (plaši lietots angļu valodas korpuss).
  • Ja runā par vairākām korpusa vienībām, latīņu daudzskaitlis ir corpora, bet latviešu valodā var lietot gan corpora, gan adaptētu formu korpusi, atkarībā no konteksta un stila.

Kopsavilkums

Corpus ir daudznozīmīgs termins ar pamats nozīmi “ķermenis”, taču mūsdienu lietojumā tas bieži norāda uz organizētu datu vai tekstu kopu (korpusu), juridiskiem un reliģiskiem nosaukumiem vai tehniskiem objektiem. Nozīme jānosaka, izvērtējot kontekstu — akadēmisks, juridisks, reliģisks vai ikdienas tehnisks.



Meklēt
AlegsaOnline.com - 2020 / 2025 - License CC3