Google Translate traduce il e in siciliano, veneto e altri 110 nuovi idiomi

giu 27, 2024

Grazie all'intelligenza artificiale, puoi ottenere traduzioni in e da un'enorme varietà di lingue e dialetti regionali di tutto il mondo.

Google Translate traduce il e in siciliano, veneto e altri 110 nuovi idiomi

Google
ha annunciato un importante aggiornamento per il suo servizio di traduzione online che rappresenta un balzo in avanti fra i più importanti mai realizzati. Basti pensare che l'aggiornamento precedente risalente al 2022 aveva aggiunto 24 nuove lingue fra quelle supportate da Translate, mentre l'annuncio odierno parla di ben 110 nuove lingue in corso di implementazione. E questa volta il miglioramento è ancor più sostanzioso e sorprendente se consideriamo che fra i 110 nuovi idiomi figurano dialetti regionali di diverse nazioni del mondo, fra cui alcuni italiani tra i più caratteristici, come il siciliano e il veneto.

Il passo è stato possibile grazie all'utilizzo in Google Translate del modello linguistico di grandi dimensioni (LLM) proprietario, PaLM 2.

Google Translate traduce il e in siciliano, veneto e altro 

Dal cantonese al Qʼeqchiʼ, queste nuove lingue rappresentano più di 614 milioni di parlanti, aprendo le traduzioni a circa l'8% della popolazione mondiale. Alcune sono le principali lingue del mondo con oltre 100 milioni di parlanti. Altri sono parlati da piccole comunità di indigeni, e alcuni non hanno quasi madrelingua ma sono attivi sforzi di rivitalizzazione. Circa un quarto delle nuove lingue provengono dall’Africa, rappresentando la nostra più grande espansione di lingue africane fino ad oggi, tra cui Fon, Kikongo, Luo, Ga, Swati, Venda e Wolof.

Quando si aggiungono nuove lingue a Translate, ci sono molti aspetti da considerare: dalle varianti che offriamo alle grafie specifiche che utilizziamo.

Le lingue presentano un'enorme quantità di variazioni: varietà regionali, dialetti, standard ortografici diversi. In effetti, molte lingue non hanno una forma standard, quindi è impossibile scegliere la varietà “giusta”. Il nostro approccio è stato quello di dare priorità alle varietà più comunemente utilizzate di ciascuna lingua. Ad esempio, il romani è una lingua che ha molti dialetti in tutta Europa. I nostri modelli producono il testo più vicino al Vlax Romani meridionale, una varietà comunemente usata online. Ma mescola anche elementi di altri, come il Vlax settentrionale e il Romani balcanico.

PaLM 2 è stato un tassello fondamentale del puzzle, aiutando Translate ad apprendere in modo più efficiente lingue strettamente correlate tra loro, comprese le lingue vicine all'hindi, come l'Awadhi e il Marwadi, e i creoli francesi come il creolo delle Seychelles e il creolo mauriziano. Con l'avanzare della tecnologia e la continua collaborazione con linguisti esperti e madrelingua, nel tempo supporteremo ancora più varietà linguistiche e convenzioni ortografiche.

Le nuove modifiche a Google Translate con il supporto di altri 110 idiomi sono in corso di implementazione sul sito Web così come sull'app per Android e iOS. Se vuoi saperne di più, punta qui.

Articolo di HTNovo
Creative Commons License

Modulo di contatto

Archivio