Generative AI: dai laboratori al grande pubblico

Contenuto Gratuito Insight Artificial Intelligence Tecnologie Marzo 2023

Da un punto di vista tecnologico il 2022 verrà ricordato come l’anno dell’affermazione dell’AI Generativa, e più nello specifico come l’anno dell’avvento al grande pubblico di due soluzioni che dai laboratori sono state rese disponibili a tecnici e non: DALL-E2 e ChatGPT. Entrambe frutto della società americana OpenAI, queste due soluzioni hanno sancito, dopo l’avvento dei deepfake, la definitiva affermazione dell’AI Generativa. Una branca dell’AI che sta raccogliendo molto interesse, in virtù del fatto che le sue applicazioni sono molteplici e spaziano dal mondo dell’arte a quello dei media, passando per il comparto manifatturiero e sanitario.

Come indicato dal nome, DALL-E2 è una nuova versione di DALL-E, il modello di Intelligenza Artificiale rilasciato nel 2021 e in grado di creare contenuti visivi partendo da descrizioni testuali. La versione del 2022, da settembre disponibile a tutti al pari di ChatGPT, offre non solo una migliore comprensione del testo, ma permette con una risoluzione maggiore di modificare immagini già esistenti e ottenere versioni differenti. Spinoff di GPT-3, anche ChatGPT è un esempio di AI Generativa: si tratta di uno dei modelli linguistici più evoluti in circolazione, progettato per fornire informazioni e risposte ai quesiti degli utenti con un linguaggio intuitivo e coerente al contesto.

Marzo 2023 segna inoltre un ulteriore traguardo evolutivo di queste tecnologie. In particolare, è stata ufficialmente rilasciata la nuova versione del modello di OpenAI che dopo GPT3 e GPT3.5 ha svelato al pubblico la versione GPT4, con una sostanziale novità: la multimodalità. L’acronimo GPT fa sempre riferimento ai Generative Pre-trained Transformer, ovvero, modelli di lingua artificiale basati sulla trasformazione, che utilizzano tecniche di apprendimento automatico avanzate per generare testo naturale che può essere utilizzato in una varietà di applicazioni, come la traduzione automatica, la generazione di testo e la risposta alle domande. La versione 4, oltre a superare le performance della precedente soprattutto nel gestire richieste complesse e produrre risposte più complete ed esaustive, ha come caratteristica più importante la multimodalità, cioè la capacità di accettare input sia di testo che di immagini. Il modello è già stato integrato in ChatGPT oltre che in Bing Chat ed è lecito attendersi che contribuirà ad alzare ulteriormente l’hype e l’asticella delle attese attorno a queste soluzioni.

Va tuttavia sottolineato che, per trovare davvero sbocco nel mondo del lavoro, sarà necessario che il modello superi alcune limitazioni, la prima delle quali è legata al fatto che gli output di tali algoritmi sono vincolati ai dataset su cui sono stati addestrati. Così si spiegano alcune imperfezioni e criticità sui risultati prodotti: ne è un esempio il fatto che DALL-E2 non sa associare un’immagine a ChatGPT o che ChatGPT non sa dare informazioni su GPT4, entrambi contenuti resi noti dopo l’addestramento di DALL-E2 e ChatGPT. Permettere ai sistemi dotati di AI di adattarsi a nuovi compiti, nuove conoscenze e a nuove condizioni di funzionamento è l’obiettivo dell’AI Adattiva: una delle sfide più attuali e dirompenti e che permetterebbe ai sistemi citati (in particolare ChatGPT) di integrare nuove conoscenze e abilità.

Il 2022 è stato un anno estremamente rilevante per l’Adaptive AI nel panorama italiano. All’interno del Partenariato esteso dedicato a “Intelligenza Artificiale: aspetti fondazionali” – dal titolo Future Artificial Intelligence Research (FAIR) – lo Spoke 4, coordinato da Politecnico di Milano e Università Bocconi, è esattamente dedicato all’Adaptive AI. Le attività di questo Spoke verteranno sulla progettazione di soluzioni fondazionali di Adaptive AI per sistemi singolo agente, multi-agente e sistemi di machine learning (con anche capacità di interazione multimodale e comprensione). Tali soluzioni saranno alla base dei sistemi di machine e deep learning del futuro.

A cura di