Scienza. La differente strutturazione della capacità informativa delle diverse lingue
Pare che la quantità di informazione trasmessa in un secondo sia sempre la stessa, indipendentemente dalla lingua.
Sono tante le lingue parlate nel mondo, secondo le ultime stime fra le 6000 e le 7000! Alcune presentano somiglianze di suoni, strutture e significati; altre sono del tutto differenti tra loro. Nel tempo, ciascuna di esse ha comunque sviluppato una propria via per codificare le informazioni, producendo un’enorme varietà di strutture logiche e repertori di suoni. Un esempio? Se l’inglese si articola in più di 7.000 sillabe distinte, il giapponese si “accontenta” di meno di 700!
Dunque, grande diversità fra gli idiomi, anche se…, pare che la quantità di informazione trasmessa in un secondo sia sempre la stessa, indipendentemente dalla lingua: circa 39 bit (nel contesto della teoria dell’informazione, il bit è l’unità di misura definita come la quantità minima di informazione che serve a discernere tra due eventi equiprobabili). E’ questo il risultato di un recente studio (pubblicato su Science Advance), realizzato da un gruppo internazionale di ricercatori, coordinati da François Pellegrino dell’Università di Lione (FR).
Quale metodo di indagine ha consentito di giungere a tali conclusioni? Anzitutto, il team di studiosi si è concentrata sull’accurata analisi di diversi testi scritti in 17 lingue, riuscendo a “pesare” in bit la quantità media di informazioni per sillaba, per le varie lingue. Solo per fare qualche esempio, il basco con ogni sillaba veicola solo 5 bit di informazione, mentre il vietnamita arriva fino a 8 bit. Passando poi all’analisi di successive registrazioni vocali nelle stesse lingue, i ricercatori hanno potuto stimare la quantità di informazioni al secondo nel parlato, come funzione del numero di sillabe pronunciate. Ancora qualche esempio: gli italiani pronunciano fino a 9 sillabe al secondo, mentre i tedeschi solo 6. Insomma, l’ulteriore conferma delle notevoli differenze di strutturazione tra un idioma e l’altro.
Tuttavia, ecco la sorpresa: facendo leggere ai volontari partecipanti uno stesso testo, tradotto nella loro lingua madre, si è visto che tutti impiegano più o meno la stessa quantità di tempo. Pare, infatti, che le lingue con sillabe più dense di informazioni vengono parlate più lentamente, e viceversa.
Riprendendo l’esempio del basco, le sue sillabe veicolano in media 5 bit di informazione ciascuna, mentre vengono pronunciate ad una frequenza di circa 8 al secondo; passando al vietnamita, le sillabe giungono a veicolare 8 bit d’informazione, ma vengono pronunciate alla frequenza di circa 5 al secondo. In entrambi i casi, quindi, il totale è di circa 40 bit al secondo. Questa quantità è poi risultata perfettamente in media con quella riscontrata in tutte le 17 lingue analizzate: 39,15 bit al secondo.
Il prossimo step di ricerca consisterà in una nuova applicazione dello stesso metodo di analisi linguistica, includendo però stavolta anche le lingue originarie di Africa, America e Oceania (non considerate in questo studio). Gli studiosi si dicono abbastanza sicuri di ottenere i medesimi risultati, ma resta un problema da risolvere: allo stato attuale, non si riesce a spiegare le ragioni di questa sostanziale uniformità di trasmissione delle informazioni in una unità di tempo. Da cosa dipende in realtà questa uniformità nella “densità di informazione al secondo” tra una lingua e l’altra? Forse essa si è assestata con l’evoluzione, sulla base della quantità massima di informazioni che l’ascoltatore può processare in un dato tempo? Oppure sulla velocità massima alla quale il parlante può organizzare ed esprimere i suoi pensieri? Quesiti che le attuali conoscenze scientifiche non permettono ancora di sciogliere. Ma è proprio questo, forse, il bello della scienza: c’è sempre da imparare qualcosa di nuovo!