L’AI per la creazione e manipolazione di testi, immagini e suoni

AI – Domande e risposte facili facili

A cura di Gianpiero Cozzolino

Cosa può fare l’AI per i testi?

Abbiamo già citato in precedenza l’utilizzo dell’intelligenza artificiale nelle traduzioni automatiche ed istantanee, ma ovviamente ci sono e ci saranno molte altre applicazioni linguistiche che prenderanno forma.

Rispetto ai sistemi di traduzione automatica “tradizionali”, l’intelligenza artificiale ha il grande vantaggio di riuscire ad usare il contesto per rendere la traduzione più precisa, raggiungendo un livello che può costituire una buona base in molti casi, ma comunque senza rappresentare ancora una reale alternativa dove serve accuratezza assoluta.

L’AI è anche in grado di effettuare con buoni risultati il lavoro di sintetizzare un testo lungo, o al contrario di sviluppare una traccia in un elaborato più lungo, fermo restando la necessità di una verifica “umana”.

Uno dei rischi che questa tecnologia porta è l’abuso in ambito scolastico e universitario, rendendo ancora più evidente l’impoverimento delle capacità linguistiche delle nuove generazioni.

Cosa può fare l’AI per le immagini?

L’elaborazione avanzata delle immagini non è certo una novità, nel cinema la correzione digitale di colori o luminosità o gli effetti speciali sono apparsi negli anni ‘90 del secolo scorso. Tuttavia, in questo campo l’AI può rappresentare un ulteriore salto di qualità, soprattutto nel campo delle correzioni e del restauro di immagini sia statiche che in movimento, rendendo il risultato finale più naturale rispetto a quanto era possibile ottenere precedentemente.

Ma il campo in cui si va maggiormente affermando l’uso dell’AI è quello di generazione di immagini completamente nuove partendo da sommarie descrizioni, con risultati decisamente notevoli; il che comporta il rischio di avere immagini talmente realistiche da non poter essere distinte da quelle vere, “documentando” avvenimenti che non sono mai avvenuti. Clamorosi, in questo senso, sono i casi di “deep fake”, ossia la sostituzione dei volti in un video, generando filmati in cui personaggi pubblici fanno dichiarazioni mai realmente nemmeno pensate, o addirittura sembrano comparire in film porno.

E comunque, anche in questo caso, la generazione di nuove opere visive comporta gli stessi problemi relativi al copyright che vedevamo prima per i testi.

Cosa può fare l’AI per i suoni?

Nel mondo dell’audio, possiamo trasportare gli stessi utilizzi e gli stessi rischi e problemi appena visti per le immagini: correzioni, effetti speciali, restauri, generazione di nuove musiche e suoni, nonché (novità degli ultimi tempi) la sintesi vocale, ossia la generazione del parlato, o persino del canto, con la voce di una specifica persona, permettendo la sostituzione della voce ai personaggi pubblici; esistono quindi già esempi di deep fake vocale, come per esempio far “cantare” ad un cantante morto da tempo l’ultimo successo appena uscito, con la sua voce e il suo stile.

Esiste anche la singolare e divertente applicazione del riconoscimento di un’opera musicale, partendo da un breve estratto o da un’esecuzione approssimata, come per esempio canticchiarla.

Ma quindi l’AI sostituirà gli artisti ed i produttori?

Effettivamente esistono anche tentativi di generazione di opere “artistiche”, siano esse di testi (poesia o prosa, testi di canzoni, sceneggiature o dialoghi per film), di immagini (brevi film, quadri digitali), che di suoni (musica); ma in questi casi si pongono diversi problemi relativi ai dati utilizzati per l’addestramento: le opere così generate possono essere considerate dei plagi? E possono essere poi sottoposte a loro volta a copyright, e se sì, chi può essere considerato l’autore? E l’utilizzo di opere soggette a copyright nella base dati di addestramento, ne comporta la violazione? Queste domande non sono teoriche, le prime cause sono già state intentate negli Stati Uniti; il problema è che praticamente in tutto il mondo manca la legislazione sulla materia.

Che ne penso?

Vedo, nell’AI e nella possibilità di avere “energia circolare” (l’AI consuma e tanto!!), un nuovo approccio sulla generazione di contenuti, già oggi vediamo la generazione di contenuti per gruppi omogenei, uomini da 35 a 40 anni sposati che vivono a nord di Roma, oppure tutti quelli che nell’ultimo mese hanno ricercato, “finale Champions” su un motore di ricerca; fra pochissimo ogni pubblicità che vedremo sarà stata creata per noi, testi, musica ed immagini, per essere sempre più permeante, insomma convincente a comprare questo o quello.

Ma sarà anche un’occasione fantastica, di poter scrivere e pubblicare la commedia ironica che da sempre volevamo scrivere ma per motivi di tempo non abbiamo più fatto, sarà fantastico poter creare il film di azione che ci rappresenta, dove potremmo con le facce dei nostri amici compiere epiche avventure modello Jumanji, dove tutto è possibile; ed infine potremmo cantare bene anzi benissimo senza nessuna pecca o errore di intonazione, l’AutoTune sarà un residuato di qualcosa di vecchio, hahaha!!! sei proprio un vecchio algoritmo gli direbbe l’AI, bene per le nostre orecchie, ma il karaoke dal vivo senza AI sarà una vera sfida per i più coraggiosi.

Sulla proprietà intellettuale dovremmo fare un salto in avanti, ma molto in avanti, a mio parere se tutto fosse a disposizione di tutti non sarebbe una brutta cosa; pensate al mare, a una bella spiaggia, ad un fantastico tramonto, paghiamo forse i diritti al creatore dell’universo?