L’intelligenza artificiale diventa multimodale

Mar 27, 2023 | Intelligenza Artificiale

Le nuove applicazioni di GPT-4 e i casi di uso reale

ChatGPT domina le scene già da alcuni mesi e non stupisce, perciò, il clamore generato dalla presentazione di GPT-4 da parte di OpenAI. Distinguere GPT-3.5 e GPT-4 in una conversazione casuale può essere difficile, ma una volta raggiunta una certa soglia di complessità le differenze emergono in maniera chiara.

GPT è l’acronimo di Generative Pretrained Transformer ed è un tipo di intelligenza artificiale detto modello linguistico di grandi dimensioni (LLM) che viene addestrato su una mole considerevole di dati raccolti sul web e impara così a individuare modelli e riprodurre stili.

La caratteristica principale di questa versione è la multimodalità, cioè la capacità di accettare input di testo e di immagini così da fornire output di testo (arriveranno poi anche le immagini).

GPT-4 è stato progettato per evitare le insidie presenti nella precedente versione e può generare stringhe di testo molto più lunghe; è anche più preciso, in grado di fornire descrizioni dettagliate o scrivere barzellette.

Il sistema, come sottolineato da OpenAI, è stato sottoposto a oltre sei mesi di formazione anche in termini di sicurezza e i risultati sono incoraggianti: GPT-4 ha l’82% in meno di probabilità di rispondere a richieste di contenuti non consentiti e il 40% in più di probabilità di produrre risposte concrete rispetto a GPT-3.5. Sono inoltre presenti nuove opzioni di controllo e un’opzione di comando che consente di impostare uno stile o un tono specifici. Le nuove caratteristiche di GPT-4 hanno così portato a nuovi utilizzi pratici, sia da parte delle aziende che di utenti singoli.

Testi più lunghi

Se GPT-3.5 era in grado di ricevere fino a circa 3mila token di input (dove per token si intendono simboli, parole e segni di punteggiatura), GPT-4 può riceverne fino a 25mila e generare testi più lunghi, fare sintesi di lunghi articoli, studi, rapporti o siti web. Funzioni utili, insomma, per lo studio, la ricerca e la produzione editoriale.

Assistenti virtuali più intelligenti

La maggiore precisione di Gpt-4 e anche la capacità di “divorare” testi lunghi può servire

La precisione di GPT-4 e la capacità di elaborare testi complessi può essere utilizzata anche per la creazione di chatbot a uso interno. Ne è un esempio Stripe, l’azienda per pagamenti digitali che insieme a GPT-4 ha creato un assistente virtuale per i propri sviluppatori, in grado di analizzare materiale tecnico, comprendere le richieste, riassumere le soluzioni e fornire sintesi di siti web. Anche Bing, il motore di ricerca di Microsoft, ha al suo interno una funzione analoga, a dimostrazione che possono essere generati chatbot per customer care migliori di quelli attuali.

Easy coding

L’utente di Twitter Pietor Schirano ha creato una versione di Pong in meno di 60 secondi, con ChatGpt 4.

E se GPT-4 rendesse più semplice anche il coding? Un utente di Twitter, Pietor Schirano, ha creato una versione di Pong in meno di 60 secondi, un altro ha creato un gioco arcade e un altro ancora ha lanciato un’app iOS. Non è un mistero che l’intelligenza artificiale sia un prezioso aiuto per gli sviluppatori e ne è un esempio, nel debug, CoPilot di Microsoft, ma applicativi come GPT-4 possono contribuire a democratizzare la realizzazione pratica della creatività umana, aprendo così fette di mercato anche a persone con competenze tecniche moderate.

Istruzione

ChatGPT, si sa, viene utilizzato anche per aiutarsi nello studio oppure creare lezioni per studenti, ma la nuova versione consenti utilizzi per scopi più sofisticati. DuoLinguo, per esempio, l’ha utilizzata per dare vita a un tutor linguistico personale che aiuta a fare pratica di conversazione e fornisce risposte agli studenti abbonati. Per il momento è disponibile solo in francese e spagnolo, ma il suo utilizzo potrebbe abbracciare presto altre lingue. Khan Academy utilizza invece GPT-4 per aiutare gli studenti attraverso un servizio di tutoraggio interattivo istantaneo.

E le immagini?

Un’altra importante novità di GPT-4 riguarda proprio la possibilità di utilizzare le immagini come input: ChatGPT riesce poi a utilizzarle come comandi oppure descriverle con testi lunghi. Durante il GPT-4 Developer Livestream, OpenAI ha presentato anche la capacità della piattaforma di utilizzare un diagramma scarabocchiato di un sito web e convertirlo poi in un sito funzionale che esegue JavaScript e genera contenuti.

Articoli correlati