La creazione automatizzata di contenuti 3D da testo è una nuova frontiera dell’intelligenza artificiale. Il framework 3D-GPT, basato su modelli linguistici di grandi dimensioni (LLM), è un promettente passo avanti in questo campo.
3D-GPT suddivide le attività procedurali di modellazione 3D in segmenti, ciascuno dei quali viene affidato ad uno specifico agente. In questo modo, ciascun agente si concentra su un aspetto della comprensione del testo.
Il processo di modellazione di 3D-GPT prevede il lavoro congiunto di tre agenti:
- Agente di invio delle attività: analizza le istruzioni di testo e le converte in istruzioni procedurali.
- Agente di concettualizzazione: inserisce dettagli mancanti nella descrizione iniziale.
- Agente di modellazione: genera il codice per guidare il software 3D.
3D-GPT è stato testato con successo su un testo descrittivo di una scena 3D. Il risultato è stato una scena 3D fedele al testo iniziale e ricca di dettagli.
La ricerca condotta su 3D-GPT dimostra come in futuro gli LLM possano essere impiegati per creare e animare scene in diversi contesti: gaming, realtà virtuale, cinema animato ed esperienze multimediali.