Visualizzazione post con etichetta linguistica. Mostra tutti i post
Visualizzazione post con etichetta linguistica. Mostra tutti i post

14 marzo 2024

Quante versioni di Wikipedia ci sono?

Quante versioni di Wikipedia ci sono?

A inizio marzo 2024 ci sono  ben 339 edizioni linguistiche di Wikipedia, con un totale di  62,638,076 voci in crescita!

esempi di lettere da alfabeti di tutto mondo
Multilingual (Luan, CC BY SA, Common Wikimedia)

Di queste edizioni 325 hanno più di 100 voci, 170 hanno più di 10,000 voci, e 71 di queste superano 100,000 voci.

Qui sotto trovate l'elenco di tutte le versioni e per ciascuna di esse il link che a loro rimanda.  

La visione di questo elenco ci fa sempre una certa impressione. Se semplicemente volete dare un'occhiata veloce ad ognuna di queste, diciamo una sbirciatina di dieci minuti tanto per farsi un'idea, vi serviranno quasi 57 ore, se decidete che dedicherete un 'ora al giorno del vostro tempo libero, per queste sbirciatine  vi serviranno quasi due mesi per visualizzarle tutte. 

Comprendete come ormai sia quasi impossibile per chiunque affermare di conoscere tutto l'universo di Wikpedia nelle sue complessità e come certe affermazioni o giudizi di merito (sia positivi, che negativi) che generalizzano sia del tutto inadatti e spesso fuorvianti.😕

Acèh (ace) · Ænglisc (ang) · Afrikaans (af) · ak (ak) · Alemannisch (als) · anarâškielâ (smn) · aragonés (an) · armãneashti (roa-rup) · arpetan (frp) · asturianu (ast) · Atikamekw (atj) · Avañe'ẽ (gn) · Aymar aru (ay) · azərbaycanca (az) · Banjar (bjn) · Bahasa Hulontalo (gor) · Bahasa Indonesia (id) · Bahasa Melayu (ms) · bamanankan (bm) · Bân-lâm-gú (zh-min-nan) · Basa Bali (ban) · Basa Banyumasan (map-bms) · Bikol Central (bcl) · Bislama (bi) · Boarisch (bar) · bosanski (bs) · brezhoneg (br) · català (ca) · Cebuano (ceb) · čeština (cs) · Chamoru (ch) · Chavacano de Zamboanga (cbk-zam) · Chi-Chewa (ny) · chiShona (sn) · chiTumbuka (tum) · corsu (co) · Cymraeg (cy) · dansk (da) · davvisámegiella (se) · Deitsch (pdc) · Deutsch (de) · Diné bizaad (nv) · dolnoserbski (dsb) · Dorerin Naoero (na) · eesti (et) · emiliàn e rumagnòl (eml) · English (en) · español (es) · Esperanto (eo) · estremeñu (ext) · euskara (eu) · eʋegbe (ee) · lea faka-Tonga (to) · Fiji Hindi (hif) · føroyskt (fo) · français (fr) · Frysk (fy) · Fulfulde (ff) · furlan (fur) · Gaeilge (ga) · kriyòl gwiyannen (gcr) · Gaelg (gv) · Gagana Samoa (sm) · Gagauz (gag) · Gàidhlig (gd) · galego (gl) · Gĩkũyũ (ki) · Hausa (ha) · Hawaiʻi (haw) · hornjoserbsce (hsb) · hrvatski (hr) · Ido (io) · Igbo (ig) · Ilokano (ilo) · interlingua (ia) · Interlingue (ie) · Iñupiatun (ik) · isiXhosa (xh) · isiZulu (zu) · íslenska (is) · italiano (it) · Jawa (jv) · Kabɩyɛ (kbp) · kalaallisut (kl) · Kapampangan (pam) · kaszëbsczi (csb) · kernowek (kw) · Ikinyarwanda (rw) · ikirundi (rn) · Kiswahili (sw) · Kongo (kg) · Kotava (avk) · Kreyòl ayisyen (ht) · kurdî (ku) · Ladin (lld) · Ladino (lad) · latgaļu (ltg) · Latina (la) · latviešu (lv) · Lëtzebuergesch (lb) · Li Niha (nia) · lietuvių (lt) · Ligure (lij) · Limburgs (li) · lingála (ln) · Lingua Franca Nova (lfn) · livvinkarjala (olo) · la .lojban. (jbo) · Luganda (lg) · lombard (lmo) · Madhurâ (mad) · magyar (hu) · Malagasy (mg) · Malti (mt) · Māori (mi) · Minangkabau (min) · 閩東語 / Mìng-dĕ̤ng-ngṳ̄ (cdo) · Mirandés (mwl) · Na Vosa Vakaviti (fj) · Nāhuatl (nah) · Napulitano (nap) · Nederlands (nl) · Nedersaksies (nds-nl) · Nēhiyawēwin / ᓀᐦᐃᔭᐍᐏᐣ (cr) · Nordfriisk (frr) · Norfuk / Pitkern (pih) · norsk bokmål (nb) · norsk nynorsk (nn) · Nouormand (nrm) · Novial (nov) · oʻzbekcha / ўзбекча (uz) · occitan (oc) · Oromoo (om) · Pälzisch (pfl) · Pangasinan (pag) · Papiamentu (pap) · Patois (jam) · Picard (pcd) · Piemontèis (pms) · Plattdüütsch (nds) · polski (pl) · português (pt) · Qaraqalpaqsha (kaa) · qırımtatarca (crh) · reo tahiti (ty) · Ripoarisch (ksh) · română (ro) · romani čhib (rmy) · rumantsch (rm) · Runa Simi (qu) · Sängö (sg) · sardu (sc) · Scots (sco) · Seeltersk (stq) · Sakizaya (szy) · Seediq (trv) · Sesotho sa Leboa (nso) · Sesotho (st) · Setswana (tn) · shqip (sq) · sicilianu (scn) · Simple English (simple) · SiSwati (ss) · slovenčina (sk) · slovenščina (sl) · ślůnski (szl) · Soomaaliga (so) · Sranantongo (srn) · srpskohrvatski / српскохрватски (sh) · Sunda (su) · suomi (fi) · svenska (sv) · Tagalog (tl) · Taqbaylit (kab) · tarandíne (roa-tara) · tetun (tet) · Thuɔŋjäŋ (din) · Tiếng Việt (vi) · Tok Pisin (tpi) · Tsetsêhestâhese (chy) · Tshivenda (ve) · Türkçe (tr) · Türkmençe (tk) · Twi (tw) · Vahcuengh (za) · vèneto (vec) · vepsän kel’ (vep) · Volapük (vo) · võro (fiu-vro) · walon (wa) · West-Vlams (vls) · Winaray (war) · Wolof (wo) · Xitsonga (ts) · Yorùbá (yo) · Zazaki (diq) · Zeêuws (zea) · žemaitėška (bat-smg) · Ελληνικά (el) · Ποντιακά (pnt) · авар (av) · адыгабзэ (ady) · адыгэбзэ (kbd) · алтай тил (alt) · аԥсшәа (ab) · башҡортса (ba) · беларуская (be) · беларуская (тарашкевіца) (be-tarask) · буряад (bxr) · български (bg) · гӀалгӀай (inh) · ирон (os) · коми (kv) · къарачай-малкъар (krc) · кыргызча (ky) · кырык мары (mrj) · қазақша (kk) · лакку (lbe) · лезги (lez) · македонски (mk) · мокшень (mdf) · монгол (mn) · нохчийн (ce) · олык марий (mhr) · перем коми (koi) · русиньскый (rue) · русский (ru) · саха тыла (sah) · словѣньскъ / ⰔⰎⰑⰂⰡⰐⰠⰔⰍⰟ (cu) · српски / srpski (sr) · татарча / tatarça (tt) · тоҷикӣ (tg) · тыва дыл (tyv) · удмурт (udm) · українська (uk) · хальмг (xal) · чӑвашла (cv) · эрзянь (myv) · հայերեն (hy) · Արեւմտահայերէն (hyw) · მარგალური (xmf) · ქართული (ka) · 𐌲𐌿𐍄𐌹𐍃𐌺 (got) · अंगिका (anp) · अवधी (awa) · कॉशुर / کٲشُر (ks) · नेपाल भाषा (new) · नेपाली (ne) · पालि (pi) · भोजपुरी (bh) · डोटेली (dty) · गोंयची कोंकणी / Gõychi Konknni (gom) · मैथिली (mai) · मराठी (mr) · संस्कृतम् (sa) · हिन्दी (hi) · অসমীয়া (as) · বিষ্ণুপ্রিয়া মণিপুরী (bpy) · বাংলা (bn) · ਪੰਜਾਬੀ (pa) · ગુજરાતી (gu) · ଓଡ଼ିଆ (or) · தமிழ் (ta) · తెలుగు (te) · ಕನ್ನಡ (kn) · ತುಳು (tcy) · മലയാളം (ml) · සිංහල (si) · ꯃꯤꯇꯩ ꯂꯣꯟ (mni) · ᱥᱟᱱᱛᱟᱲᱤ (sat) · ཇོང་ཁ (dz) · བོད་ཡིག (bo) · ไทย (th) · ລາວ (lo) · ភាសាខ្មែរ (km) · ဘာသာမန် (mnw) · မြန်မာဘာသာ (my) · Basa Ugi (bug) · ၽႃႇသႃႇတႆး (shn) · ᐃᓄᒃᑎᑐᑦ / inuktitut (iu) · ᏣᎳᎩ (chr) · ትግርኛ (ti) · አማርኛ (am) · 한국어 (ko) · 日本語 (ja) · 中文 (zh) · 文言 (zh-classical) · 吴语 (wuu) · 客家語/Hak-kâ-ngî (hak) · 粵語 (zh-yue) · 贛語 (gan) · ייִדיש (yi) · עברית (he) · اردو (ur) · العربية (ar) · الدارجة (ary) · پښتو (ps) · سرائیکی (skr) · سنڌي (sd) · پنجابی (pnb) · فارسی (fa) · گیلکی (glk) · مازِرونی (mzn) · مصرى (arz) · تۆرکجه (azb) · لۊری شومالی (lrc) · ئۇيغۇرچە / Uyghurche (ug) · کوردی (ckb) · ܐܪܡܝܐ (arc) · ދިވެހިބަސް (dv) · ߒߞߏ (nqo) 

Per ora siamo arrivati qui 😍

11 marzo 2024

Il problema della traslitterazione

Il problema della traslitterazione

La raccolta e condivisione del sapere da tutto il mondo presenta alcuni problemi "tecnici" intrinseci alle diverse culture, uno di questi è dato dalla necessità di far coesistere i differenti alfabeti esistenti nel mondo reale.

Diversi modi di rappresentare la lettera A nei diversi alfabeti del mondo
Hill, CC BY SA 3.0

La lingua italiana utilizza l'alfabeto latino e fin qui tutto bene per la maggior parte delle voci, i problemi nascono quando occorre riportare nella Wikipedia in lingua italiana i nomi di cose, persone, paesi, ecc., appartenenti ad aree la cui lingua, oltre a non essere quella italiana, viene pure scritta utilizzando un alfabeto totalmente diverso dall'alfabeto latino, quale il russo, l'ebraico, l'arabo, il coreano, il cinese, il giapponese e tantissime altre.

Definizione della traslitterazione

Che la traslitterazione non sia un affare semplice lo si può capire osservando l'evoluzione dell'incipit della voce "Traslitterazione" in Wikipedia: 

2005: 

Per traslitterazione si intende la trascrizione di un testo secondo un sistema alfabetico diverso dall'originale, non secondo il criterio fonetico, bensì facendo corrispondere lettera a lettera in modo da permettere la ricostruzione del testo originale anche in base alla conoscenza del solo alfabeto del testo traslitterato.In italiano si usa traslitterare le parole greche, così come quelle arabe e di altre lingue di cui i lettori non conoscono il sistema di segni grafici.

2024:

La traslitterazione (o translitterazione) è l'operazione consistente nel trasporre i grafemi di un sistema di scrittura nei grafemi di un altro sistema di scrittura (generalmente un alfabeto), in modo tale che ad uno stesso grafema o sequenza di grafemi del sistema di partenza corrisponda sempre uno stesso grafema o sequenza di grafemi del sistema di scrittura di arrivo, e ciò indipendentemente dalla pronuncia delle due lingue. I due sistemi di scrittura devono dunque essere equipollenti: una traslitterazione non può essere ambigua e la corrispondenza tra gli elementi dei due sistemi grafici deve essere biunivoca. A partire da una traslitterazione bisogna essere in grado di ricostruire il testo nel sistema di scrittura originale. La traslitterazione non deve essere confusa con la trascrizione, che consiste invece di una trasposizione scritta dei foni (trascrizione fonetica) o dei fonemi (trascrizione fonematica) di una lingua utilizzando sistemi di scrittura ideati per questi usi.

Traslitterazione nel mondo reale

Va da sé che la traslitterazione di queste parole in lingua italiana, nel mondo reale, spesso è lasciata al caso, alla consuetudine adottata per ciascuna di queste parole, quando queste vengono introdotte per la prima volta in un testo scritto in italiano. Oggi frequentemente nell'italiano giornalistico una parola viene trascritta così come viene trovata sul lancio di un'agenzia di stampa in lingua inglese, senza una precisa regola di traslitterazione, neppure dal testo in alfabeto non latino al testo in inglese e questo può creare confusione, quando il medesimo none è scritto, di volta in volta, con una sequenza differente di lettere. Molto più banalmente nella scrittura quotidiana spesso viene utilizzata una trascrizione fonetica che approssima la traslitterazione.

Questa problematica non esiste soltanto per la lingua italiana e si ritrova per qualunque versione linguistica di wikipedia, dove per ognuna di esse la traslitterazione deve o dovrebbe essere trattata con omogeneità per avere, almeno all'interno della stessa versione di Wikipedia, un'omogeneità di scrittura.  

collage di tanti  modi di scrivere il nome di Einsestein presi da esempi in rete
Il nome di Eisenstein in rete (collage   DdC)

Per arrivare a questa omogeneità, sono state definite delle precise regole per la traslitterazione dei testi da altre lingue. Qui, se volete, potete trovare la linea guida per la traslitterazione di nomi originariamente scritti in una lingua che utilizza l'alfabeto cirillico (per esempio la lingua russa) per le pagine di Wikipedia italiana.

Traslitterazione nelle diverse Wikipedie

Osserviamo un caso pratico: il cognome del famoso registra sovietico, nato a Riga in Lettonia (quando questa nazione era nel Governatorato della Livonia incluso nell'Impero Russo), e morto a Mosca al tempo dell'Unione Sovietica, normalmente scritto in italiano come Einsestein

In questa pagina di Wikidata possiamo vedere come il suo cognome venga reso nelle diverse versioni linguistiche (mentre scriviamo questo post la sua voce compare in 117 versioni linguistiche), per permettere confronti qui sotto sono riportate alcune traslitterazioni adottate:

Lettone:          Sergejs Eizenšteins
Russa:             Эйзенштейн, Сергей Михайлович
Ukraina:         Ейзенштейн Сергій Михайлович
Slovena        Sergej Mihajlovič Eisenstein
Greca:             Σεργκέι Αϊζενστάιν
Ebraica:           סרגיי אייזנשטיין
Olandese:        Sergej Eisenstein
Coreana:         세르게이 예이젠시테인
Araba:             سيرجي آيزنشتاين
Mengreliana : სერგეი ეიზენშტეინი
Tedesca:         Sergei Michailowitsch Eisenstein
Latina:            Sergius Eisenstein  (Sergius Michaelis filius Eisenstein nell'incipit della voce)
Occitana:        Sergei Eisenstein
Spagnola:       Serguéi Eisenstein
Inglese:           Sergei Eisenstein
Francese:        Sergueï Eisenstein
Rumena:         Serghei Eisenstein
Portoghese   Serguei Eisenstein
Italiana:          Sergej Michajlovič Ėjzenštejn

E' interessante osservare come, la scelta di operare secondo precise regole nella traslitterazione di Wikipedia italiana, conduca alla scrittura del cognome che è decisamente diversa sia da quella operata da altre versioni  di Wikipedia in lingue romanze e sia da quanto vi possa accadere di leggere altrove, anche in altri testi scritti in italiano all'esterno dell'universo wikipediano.

Infine, facendo ricerche in rete (Google, Amzon, ecc.) si riscontra che i risultati ottenuti sono leggermente differenti se la ricerca viene fatta cercando Ėjzenštejn, oppure Eisenstein o Eizenšteins



♦ Più recente

La festa della Liberazione e accesso alle voci

La festa della Liberazione e accesso alle voci di Wikipedia I due diversi incipit, sia in testo e iconografia,  delle voci sulla Resisten...

♦ Post più visualizzati