12 marzo 2024

Le categorie delle voci

Le categorie delle voci

La comprensione del sistema di categorizzazione delle voci è molto utile per una proficua consultazione dell'enciclopedia. Questo in quanto Wikipedia non è strutturata come un'enciclopedia sistematica, ma è costituita da un'enormità di tante singole voci (al momento in cui scriviamo ci sono 1 854 813 voci in quella italiana), quindi per avere un'ordine tra queste, che ne faciliti la consultazione, ogni voce in wikipedia viene categorizzata, permettendo così il suo inserimento in un sistema ordinato della conoscenza e strutturato secondo criteri razionali.

Questo è possibile perché ogni oggetto del sapere è categorizzatile per argomenti, che a loro volta sono categorizzabili in argomenti sempre più vasti.  Spesso sua volta una categoria può essere suddivisa in cascata in categorie inferiori che si limitano ad una caratteristica del soggetto. 

In teoria è possibile categorizzare ogni voce secondo infinite caratteristiche: per esempio un fiore potrebbe essere categorizzato per il suo colore, numero dei petali, profumo, significato allegorico, genere botanico di appartenenza, commestibilità, mese di fioritura, rarità, facilità di coltivazione, provenienza originaria, se da piante perenne o annuale, farmacopea, dimensione della corolla, altezza della pianta, presenza o assenza di spine, da interno o esterno, ecc. E'  evidente che alcune categorizzazioni sono utili ai fini di un'enciclopedia e altre inutili o non sistematiche o quanto meno non rilevanti o non chiaramente definibili.

Di conseguenza la categorizzazione in Wikipedia richiede di seguire alcune specifiche:
  • oggettività del criterio di inclusione, che deve dev'essere finito, ben chiaro e basato su fatti incontrovertibili;
  • rilevanza: ogni categoria deve rappresentare un argomento utile e con rilievo enciclopedico.
  • Utilità: ogni categoria deve essere funzionale, e quindi utile, agli scopi dell'enciclopedia
A sua volta ogni categoria così definita, deve essere a sua volta categorizzata, diventando nell'enciclopedia, una componente di una categoria a lei superiore.
Spesso contemporaneamente la categoria ingloba sotto categorie.

Le categorie in cui una voce viene classificata si trovano elencate al fondo della voce.

Posizione delle categorie in una voce di Wikipedia
Posizione delle categorie (CC BY SA 4.0)

Navigare nelle categorie

Osserviamo, in un caso pratico, come è possibile utilizzarle per approfondimenti:  osservando la voce su Annibale, il grande condottiero cartaginese, troviamo che la sua voce è caratterizzata dall'essere inserita in 14 categorie.

Le categorie di una voce in wikipedia
Categorie di Annibale (CC BY SA 4.0)

Essendo Annibale un personaggio storico importante esiste la categoria omonima "Annibale", che  raccoglierà  voci di approfondimento che lo riguardano, facendo click su questa categoria otteniamo:
Categoria Annibale (CC BY SA 4.0)

e scopriamo che ci sono 27 voci nelle quali la figura di Annibale è un elemento classificatorio, e altre 3 categorie, che trovo sempre a fondo voce, che includono queste voci, nelle quali posso proseguire la mia navigazione.

Partendo invece da un'altra categoria, sempre tra quelle presenti nella voce Annibale, per esempio, quella della Storia di Cartaginemi troverò in a categoria superiore classificata, tra le varie caratteristiche, come Civiltà punica, da qui posso risalire a Storia del nord Africa,  quindi a Nordafrica,  quindi a Regioni geografiche, quindi a Geografia, poi Scienze sociali, quindi Società, infine a Enciclopedia contenuta in Categorie ! in cui ritrovo Enciclopedia e quindi fine della navigazione, siamo ai bordi dell'universo, dove convergono tutte le categorie. 
Siamo arrivati alla base, alla radice delle categorie e ... del sapere.
Volendo razionalizzare, trovando un significato epistemologico, osserviamo che con questa categorizzazione  la categoria: "Enciclopedia" diventa l'insieme_universo del sapere umano.🦉
 
Le categorie di wikipedia rappresentate come insiemi
 
Le categorie da Annibale a Enciclopedia (CC BY SA 4.0)

E' evidente come sia importante decidere quali categorie utilizzare, se non crearne altre nuove,  per caratterizzare una voce o anche gruppi di voci aventi qualcosa in comune, che permettano di avere una o più categorie entro cui inserire queste voci.  
Ma per descrivere questo processo serviranno altri spizziki.😄






11 marzo 2024

Il problema della traslitterazione

Il problema della traslitterazione

La raccolta e condivisione del sapere da tutto il mondo presenta alcuni problemi "tecnici" intrinseci alle diverse culture, uno di questi è dato dalla necessità di far coesistere i differenti alfabeti esistenti nel mondo reale.

Diversi modi di rappresentare la lettera A nei diversi alfabeti del mondo
Hill, CC BY SA 3.0

La lingua italiana utilizza l'alfabeto latino e fin qui tutto bene per la maggior parte delle voci, i problemi nascono quando occorre riportare nella Wikipedia in lingua italiana i nomi di cose, persone, paesi, ecc., appartenenti ad aree la cui lingua, oltre a non essere quella italiana, viene pure scritta utilizzando un alfabeto totalmente diverso dall'alfabeto latino, quale il russo, l'ebraico, l'arabo, il coreano, il cinese, il giapponese e tantissime altre.

Definizione della traslitterazione

Che la traslitterazione non sia un affare semplice lo si può capire osservando l'evoluzione dell'incipit della voce "Traslitterazione" in Wikipedia: 

2005: 

Per traslitterazione si intende la trascrizione di un testo secondo un sistema alfabetico diverso dall'originale, non secondo il criterio fonetico, bensì facendo corrispondere lettera a lettera in modo da permettere la ricostruzione del testo originale anche in base alla conoscenza del solo alfabeto del testo traslitterato.In italiano si usa traslitterare le parole greche, così come quelle arabe e di altre lingue di cui i lettori non conoscono il sistema di segni grafici.

2024:

La traslitterazione (o translitterazione) è l'operazione consistente nel trasporre i grafemi di un sistema di scrittura nei grafemi di un altro sistema di scrittura (generalmente un alfabeto), in modo tale che ad uno stesso grafema o sequenza di grafemi del sistema di partenza corrisponda sempre uno stesso grafema o sequenza di grafemi del sistema di scrittura di arrivo, e ciò indipendentemente dalla pronuncia delle due lingue. I due sistemi di scrittura devono dunque essere equipollenti: una traslitterazione non può essere ambigua e la corrispondenza tra gli elementi dei due sistemi grafici deve essere biunivoca. A partire da una traslitterazione bisogna essere in grado di ricostruire il testo nel sistema di scrittura originale. La traslitterazione non deve essere confusa con la trascrizione, che consiste invece di una trasposizione scritta dei foni (trascrizione fonetica) o dei fonemi (trascrizione fonematica) di una lingua utilizzando sistemi di scrittura ideati per questi usi.

Traslitterazione nel mondo reale

Va da sé che la traslitterazione di queste parole in lingua italiana, nel mondo reale, spesso è lasciata al caso, alla consuetudine adottata per ciascuna di queste parole, quando queste vengono introdotte per la prima volta in un testo scritto in italiano. Oggi frequentemente nell'italiano giornalistico una parola viene trascritta così come viene trovata sul lancio di un'agenzia di stampa in lingua inglese, senza una precisa regola di traslitterazione, neppure dal testo in alfabeto non latino al testo in inglese e questo può creare confusione, quando il medesimo none è scritto, di volta in volta, con una sequenza differente di lettere. Molto più banalmente nella scrittura quotidiana spesso viene utilizzata una trascrizione fonetica che approssima la traslitterazione.

Questa problematica non esiste soltanto per la lingua italiana e si ritrova per qualunque versione linguistica di wikipedia, dove per ognuna di esse la traslitterazione deve o dovrebbe essere trattata con omogeneità per avere, almeno all'interno della stessa versione di Wikipedia, un'omogeneità di scrittura.  

collage di tanti  modi di scrivere il nome di Einsestein presi da esempi in rete
Il nome di Eisenstein in rete (collage   DdC)

Per arrivare a questa omogeneità, sono state definite delle precise regole per la traslitterazione dei testi da altre lingue. Qui, se volete, potete trovare la linea guida per la traslitterazione di nomi originariamente scritti in una lingua che utilizza l'alfabeto cirillico (per esempio la lingua russa) per le pagine di Wikipedia italiana.

Traslitterazione nelle diverse Wikipedie

Osserviamo un caso pratico: il cognome del famoso registra sovietico, nato a Riga in Lettonia (quando questa nazione era nel Governatorato della Livonia incluso nell'Impero Russo), e morto a Mosca al tempo dell'Unione Sovietica, normalmente scritto in italiano come Einsestein

In questa pagina di Wikidata possiamo vedere come il suo cognome venga reso nelle diverse versioni linguistiche (mentre scriviamo questo post la sua voce compare in 117 versioni linguistiche), per permettere confronti qui sotto sono riportate alcune traslitterazioni adottate:

Lettone:          Sergejs Eizenšteins
Russa:             Эйзенштейн, Сергей Михайлович
Ukraina:         Ейзенштейн Сергій Михайлович
Slovena        Sergej Mihajlovič Eisenstein
Greca:             Σεργκέι Αϊζενστάιν
Ebraica:           סרגיי אייזנשטיין
Olandese:        Sergej Eisenstein
Coreana:         세르게이 예이젠시테인
Araba:             سيرجي آيزنشتاين
Mengreliana : სერგეი ეიზენშტეინი
Tedesca:         Sergei Michailowitsch Eisenstein
Latina:            Sergius Eisenstein  (Sergius Michaelis filius Eisenstein nell'incipit della voce)
Occitana:        Sergei Eisenstein
Spagnola:       Serguéi Eisenstein
Inglese:           Sergei Eisenstein
Francese:        Sergueï Eisenstein
Rumena:         Serghei Eisenstein
Portoghese   Serguei Eisenstein
Italiana:          Sergej Michajlovič Ėjzenštejn

E' interessante osservare come, la scelta di operare secondo precise regole nella traslitterazione di Wikipedia italiana, conduca alla scrittura del cognome che è decisamente diversa sia da quella operata da altre versioni  di Wikipedia in lingue romanze e sia da quanto vi possa accadere di leggere altrove, anche in altri testi scritti in italiano all'esterno dell'universo wikipediano.

Infine, facendo ricerche in rete (Google, Amzon, ecc.) si riscontra che i risultati ottenuti sono leggermente differenti se la ricerca viene fatta cercando Ėjzenštejn, oppure Eisenstein o Eizenšteins



10 marzo 2024

Enciclopedia libera, ossia ...

Il significato di enciclopedia libera e suoi fraintendimenti

Una delle frasi più fraintese  su Wikipedia è quella che Wikipedia è l'enciclopedia libera.

L'assunto che sia un'enciclopedia libera è ben scritto nel suo terzo pilastro, tuttavia occorre intenderci per cosa si intende che sia libera.

E' libera perché ...

E' liberamente aperta  al contributo di tutte le persone  che desiderano contribuire alla sua scrittura e miglioramento secondo le finalità della diffusione del sapere, ed il motto con cui venne lanciata la sfida alla ricerca di volontari è:

 The free encyclopedia that anyone can edit 

L'enciclopedia libera che chiunque può modificare

E' libera perché è completamente gratuita nel suo utilizzo, non richiede royalty o pagamento di canoni o di licenze d'uso, i suoi contenuti sono liberamente utilizzabili e ridistribuibili, secondo i termini della licenza CC  BY SA, questo significa che sono disponibili per essere commercializzati, sempre a patto di seguire la licenza

E' libera perché  mantenere un punto di vista neutrale, indipendente da adesioni a orientamenti ideologici  e vuole mantenersi libera anche da legami economici che potrebbero influenzarla.

E' libera perché chi vi scrive non deve sentirsi obbligato a scrivere come vuole e quello che vuole regime politico vigente nel paese in cui si trova, anche se purtroppo non può dare garanzia di immunità.

E' libera perché non accetta censure preventiva, la sua scrittura non è sotto controllo di censura e i suoi testi non sono sottoposti a censure che filtrino la loro pubblicazione.

Fraintendimenti dell'essere libera

Tuttavia libera non significa che chiunque possa arrivare in Wikipedia e fare quello che vuole in  nome della Libertà di parola, del diritto di pensiero o di quello di espressione. 

Libertà di parola, ad Hyde Park speakers corner, ma i cui contenuti non sono enciclopedici
Libertà di parola, ma contenuti non enciclopedici (CGP Grey, CC BY sa 2.0 Common Wikimedia, PD)

I volontari di Wikipedia hanno un elevato concetto e enorme considerazione per la libertà di pensiero, di opinione, di parola, ma paradossalmente la scrittura dell'enciclopedia evita la scrittura secondo l'opinione di chi scrive o il suo pensiero, poiché si chiede una scrittura obiettiva e neutrale. Inoltre in caso di disaccordi o discussioni sui contenuti di una voce, durante la sua scrittura occorre raggiungere il consenso.

Il suo spazio digitale è messo a disposizione da un'organizzazione privata non avente scopo di lucro, col preciso e unico scopo di scrivere un'enciclopedia, i vandalismi e le promozioni non sono accettati.

Wikipedia vuole essere un'enciclopedia e quindi non è una raccolta indiscriminata di informazioni, di testi, non è un sostituto di un giornale, non è un forum di discussione, e neppure un social,  non è un annuario di aziende, non è una raccolta di curriculum vitae, non è una vetrina per saggi e ricerche originali.

In altre parole non si possono inserire informazioni ritenute non enciclopediche, e se si  riflette è proprio il volersi attenere a questa linea che ha permesso di mantenere viva l'enciclopedia. Se si fossero accettate voci su qualunque argomento, senza una minima selezione di enciclopedicità oggi, dopo più di vent'anni di vita, ogni versione di Wikipedia avrebbe dimensioni abnormi, ogni persona si sarebbe sentita autorizzata ad inserirci voci a suo piacere sui propri avi, ogni candidato politico avrebbe inserito la sua biografia e il suo programma politico, ogni pittore domenicale la sua voce con i suoi quadri, ogni inventore la sua invenzione, tutti gli aspiranti scrittori e poeti la loro vita e opere, ogni bottega la sua voce, eccetera, perché ognuno ha qualcosa che vuol far conoscere al mondo oppure per la quale vuole farsi conoscere. Si sarebbe arrivati a produrre una enorme raccolta indifferenziata con l'impossibilità di dipanarsi fra il rilevante e l'irrilevante, il vero e le fake e Wikipedia sarebbe annegata far i miliardi di kilobyte di  contenuti in rete senza valore.

Sopratutto Wikipedia non è un sito in rete da poter utilizzare gratuitamente per fare qualunque tipo di promozione e vetrina a persone, cose, prodotti, ideologie e tutto quanto potrebbe godere da propaganda o visibilità diffusa nella rete utilizzando uno dei siti con maggior popolarità in rete.



♦ Più recente

Verba volant, scripta manent, rete evanescit , et Wikipedia?

Verba volant, scripta manent,  rete evanescit , et Wikipedia? Qual'è il supporto più duraturo? Oggi le  tavolette cuineiformi in cr...

♦ Post più visualizzati