Event Date: Tuesday, 11 June, 2024
Location: 10:00-12:00, Sala delle Colonne, Pal. Venera (I piano)
Speaker: Prof. Roberto Zamparelli (University of Trento)
Title: Un immagine  e mille parole. Riflessioni sulla generazione di testo e immagini
Abstract: La ricerca recente sull’intelligenza artificiale che si occupa di linguaggio e di visione contiene sistemi che forniscono descrizioni testuali di immagini (L2T, p.es. didascalie), immagini a partire da suggerimenti linguistici (T2I, generazione di immagini), linguaggio a partire da altro linguaggo (T2T, p.es. riassunti), immagini a partire da immagini (I2I, p.es.  upscaling), immagini a partire da immagini e linguaggio (I+L2I). Grandi assenti sono sistemi in grado di generare testo E immagini in modo complementare (a partire da sole immagini o linguaggio, o da una combinazione dei due) e di farlo a una velocità sufficientemente elevata da essere interattivi. Uno dei motivi di questa assenza è che gli esseri umani non sono in grado di compiere questo compito (siamo generatori rapidi di testo, non di immagini), quindi i dati di addestramento diretto per questo compito sono virtualmente inesistenti. In questo intervento farò alcune considerazioni preliminari su cosa si potrebbe fare per avere sistemi I+T, a cosa potrebbero servire, come il linguaggio potrebbe o dovrebbe condizionare le immagini e viceversa.
Roberto Zamparelli è professore di linguistica presso il Centro Interdipartimentale Mente/Cervello – CIMEC dell’Università di Trento. Esperto di linguistica generativa e semantica formale, Roberto Zamparelli ha realizzato influenti contributi nell’ambito della linguistica computazionale, con particolare riguardo al trattamento della composizionalità nella semantica distribuzionale e l’analisi delle abilità sintattiche dei più recenti modelli neurali.