Spanish English French German Italian Portuguese
Social marketing
CasaGuida alla letturaAI: sintesi dei concetti principali

AI: sintesi dei concetti principali

L'intelligenza artificiale è presente apparentemente in ogni aspetto della vita moderna, dalla musica e dai media agli affari e alla produttività, persino nelle relazioni personali. C'è così tanto da fare che può essere difficile tenere il passo, quindi ecco una breve panoramica dei concetti, dagli ultimi grandi sviluppi ai termini e alle aziende che devi conoscere per rimanere aggiornato in questo campo in rapida evoluzione.

Per cominciare, dobbiamo essere tutti sulla stessa pagina: cos'è l'IA?

La intelligenza artificiale, chiamato anche Machine Learning (ML), è un tipo di sistema software basato su reti neurali, una tecnica che in realtà è stata sperimentata decenni fa ma che è recentemente fiorita grazie a nuove potenti risorse di calcolo. L'intelligenza artificiale ha consentito un riconoscimento vocale e delle immagini efficace, nonché la capacità di generare immagini e voci sintetiche, e i ricercatori stanno lavorando sodo per consentire a un'intelligenza artificiale di navigare sul Web, effettuare prenotazioni, modificare ricette e altro ancora.

Questa guida AI è divisa in tre parti che possono essere lette in qualsiasi ordine:

  • Prima, i concetti fondamentali che devono essere conosciuti, compresi i più importanti di recente.
  • Poi, una panoramica dei principali attori dell'IA e del perché sono importanti.
  • E infine, un elenco curato di titoli e sviluppi recenti.

AI 101

Reti neurali artificiali di apprendimento profondo che formano la forma del cervello umano. La rete neurale gestisce i dati in input e fornisce risultati in output

Una delle cose interessanti dell'intelligenza artificiale è che mentre i concetti di base risalgono a più di 50 anni fa, pochi di essi erano familiari anche ai tecnici prima di molto tempo fa. Se hai la sensazione di esserti perso, non preoccuparti, quasi tutti lo sono.

E un altro concetto da valorizzare: sebbene si chiami "intelligenza artificiale", quel termine è un po' fuorviante. Non esiste un'unica definizione di intelligenza, ma ciò che fanno questi sistemi è decisamente più vicino ai calcolatori che al cervello. L'input e l'output di questa calcolatrice è molto più flessibile. Si potrebbe pensare all'intelligenza artificiale come a una simulazione artificiale: è imitazione dell'intelligenza.

Detto questo, questi sono termini di base che si trovano in qualsiasi discussione sull'IA.

Rete neurale

I nostri cervelli sono costituiti in gran parte da cellule interconnesse chiamate neuroni, che si uniscono per formare reti complesse che eseguono compiti e immagazzinano informazioni. Sono stati fatti tentativi per ricreare questo incredibile sistema nel software sin dagli anni '60, ma la potenza di elaborazione richiesta non era ampiamente disponibile fino a 15-20 anni fa, quando le GPU hanno permesso alle reti neurali definite digitalmente di prosperare. Al suo centro, ci sono solo molti punti e linee: i punti sono dati e le linee sono relazioni statistiche tra quei valori. Proprio come nel cervello, questo può creare un sistema versatile che riceve rapidamente input, lo passa attraverso la rete e produce output. Questo sistema è chiamato modello.

Modello

El modello è l'effettiva raccolta di codice che accetta l'input e restituisce l'output. La somiglianza nella terminologia con un modello statistico o un sistema di modellazione che simula un processo naturale complesso non è casuale. Nell'intelligenza artificiale, il modello può fare riferimento a un intero sistema come ChatGPT o praticamente a qualsiasi costrutto di intelligenza artificiale o apprendimento automatico, indipendentemente da ciò che fa o produce. I modelli sono disponibili in varie dimensioni, il che significa sia la quantità di spazio di archiviazione che occupano sia la potenza di calcolo di cui hanno bisogno per funzionare. E questi dipendono da come viene addestrato il modello.

Preparazione / Formazione

Per creare un modello AI, le reti neurali che costituiscono la base del sistema sono esposte a una grande quantità di informazioni in quello che viene chiamato insieme di dati o corpus. In questo modo, queste reti giganti creano una rappresentazione statistica di quei dati. Questo processo di formazione è la parte più intensiva dal punto di vista computazionale, il che significa che richiede settimane o mesi (può durare quanto necessario) su enormi matrici di computer ad alta potenza. La ragione di ciò è che non solo le reti sono complesse, ma i set di dati possono essere estremamente grandi: miliardi di parole o immagini che devono essere analizzate e rappresentate nel gigantesco modello statistico. D'altra parte, una volta terminata la cottura del modello, può essere molto più piccolo e meno impegnativo quando viene utilizzato, si chiama questo processo inferenza.

Inferenza

Quando il modello sta effettivamente facendo il suo lavoro, lo chiamiamo inferenza, in gran parte nel senso tradizionale del termine: trarre una conclusione ragionando sulle prove disponibili. Ovviamente, non si tratta esattamente di "ragionamento", ma piuttosto di collegare statisticamente i punti nei dati che hai ingerito e di prevedere effettivamente il punto successivo. Ad esempio, dicendo "Completa la seguente sequenza: rosso, arancione, giallo..." troverebbe che queste parole corrispondono all'inizio di un elenco che ha ingerito, i colori dell'arcobaleno e dedurrà l'elemento successivo finché non ha prodotto il resto di quella lista. . L'inferenza è generalmente molto meno costosa dal punto di vista computazionale della formazione: pensala come guardare un catalogo di carte invece di assemblarlo. I modelli grandi devono ancora funzionare su supercomputer e GPU, ma quelli più piccoli possono funzionare su uno smartphone o qualcosa di ancora più semplice.

IA generativa

Tutti parlano di intelligenza artificiale generativa e questo termine generico indica semplicemente un modello di intelligenza artificiale che produce un risultato originale, come un'immagine o un testo. Alcune IA riassumono, altre riorganizzano, altre identificano, ecc., ma un'IA che effettivamente genera qualcosa (che "creda" o meno è discutibile) è particolarmente popolare in questo momento. Non dimenticare che solo perché un'intelligenza artificiale ha generato qualcosa, ciò non significa che sia corretto o che rifletta affatto la realtà. Semplicemente non esisteva prima che tu lo chiedessi, come una storia o un dipinto.


termini attuali

Al di là delle nozioni di base, questi sono i termini AI più rilevanti a metà del 2023.

Modello di linguaggio esteso (LLM)

La forma più influente e versatile di intelligenza artificiale disponibile oggi, i modelli di linguaggio di grandi dimensioni vengono addestrati su quasi tutto il testo che compone il Web e gran parte della letteratura in lingua inglese. L'ingestione di tutto ciò si traduce in un enorme modello di base. Gli LLM possono conversare e rispondere a domande in linguaggio naturale e imitare una varietà di stili e tipi di documenti scritti, come dimostrato da ChatGPT, Claude e LLaMa. Sebbene questi modelli siano innegabilmente impressionanti, va notato che sono ancora motori di riconoscimento di modelli e quando rispondono, è un tentativo di completare un modello che hai identificato, indipendentemente dal fatto che quel modello rifletta o meno la realtà. Gli LLM spesso hanno allucinazioni nelle loro risposte, a cui arriveremo tra poco.

Modello Fondamentale

L'addestramento di un modello enorme da zero su set di dati di grandi dimensioni è costoso e complesso, quindi non vuoi doverlo fare più del necessario. I modelli di base sono i più grandi da zero che necessitano di supercomputer per funzionare, ma possono essere ridotti per adattarsi a contenitori più piccoli, di solito riducendo il numero di parametri. Puoi pensare a questi come ai punti totali con cui il modello deve lavorare, e in questi giorni può essere in milioni, miliardi o addirittura trilioni.

Regolazione fine del modello

Un modello di base come GPT-4 è intelligente, ma è anche generalista per progettazione: ha assorbito tutto, da Dickens a Wittgenstein alle regole di Dungeons & Dragons, ma niente di tutto ciò è utile se vuoi che ti aiuti a scrivere una lettera di accompagnamento per un curriculum . Fortunatamente, i modelli possono essere messi a punto dando loro un po' di formazione aggiuntiva utilizzando un set di dati specializzato, diciamo qualche migliaio di domande di lavoro in giro. Questo dà al modello un'idea molto migliore di come aiutare in quel dominio senza buttare via la conoscenza generale che ha raccolto dal resto dei dati di addestramento.

L'apprendimento per rinforzo dal feedback umano, o RLHF, è un tipo speciale di messa a punto di cui si sente molto parlare: utilizza i dati degli esseri umani che interagiscono con l'LLM per migliorare le proprie capacità comunicative.

emittente

La generazione di immagini può essere eseguita in molti modi, ma il maggior successo finora è la diffusione, che è la tecnica alla base di Stable Diffusion, Midjourney e altre popolari IA generative. I modelli di diffusione vengono addestrati mostrando loro immagini che vengono gradualmente degradate aggiungendo rumore digitale fino a quando non rimane nulla dell'originale. Osservando ciò, i modelli di diffusione imparano anche a invertire il processo, aggiungendo gradualmente dettagli al rumore puro per formare un'immagine definita arbitrariamente. Stiamo già iniziando ad andare oltre questo per l'imaging, ma la tecnica è affidabile e relativamente ben compresa, quindi non aspettarti che scompaia presto.

allucinazione

In origine, questo era un problema di alcune immagini durante l'addestramento che scivolavano in uno sbocco non correlato, come edifici che sembravano fatti di cani a causa di una prevalenza eccessiva di cani sul set di addestramento. Ora si dice che sia un'intelligenza artificiale Allucinante quando, poiché hai dati insufficienti o contrastanti nel tuo set di allenamento, inventi qualcosa.

Questo può essere un'attività o una passività; un'intelligenza artificiale a cui è stato chiesto di creare opere d'arte originali o addirittura derivate sta allucinando il suo output; a un LLM può essere detto di scrivere una poesia d'amore nello stile di Yogi Berra, e lo farà felicemente, nonostante una cosa del genere non esista da nessuna parte nel suo set di dati. Ma può essere un problema quando si desidera una risposta fattuale; i modelli presenteranno con sicurezza una risposta che è metà reale e metà allucinazione. Al momento non c'è un modo semplice per dire quale sia quale se non controllando voi stessi, perché il modello stesso non sa effettivamente cosa sia "vero" o "falso", sta solo cercando di completare uno schema nel miglior modo possibile.

Intelligenza Artificiale Forte, AIF, (Artificial General Intelligence, AGI)

L'Intelligenza Generale Artificiale, o IA forte, non è proprio un concetto ben definito, ma la spiegazione più semplice è che si tratta di un'intelligenza abbastanza potente non solo per fare quello che fanno le persone, ma per imparare e migliorare come facciamo noi. Alcuni temono che questo ciclo di apprendimento, l'integrazione di quelle idee, e quindi l'apprendimento e la crescita più rapida si autoperpetuino e si traducano in un sistema super intelligente impossibile da frenare o controllare. Alcuni hanno persino proposto di ritardare o limitare la ricerca per prevenire questa possibilità.

È un'idea terrificante, certo, e film come "The Matrix" e "Terminator" hanno esplorato cosa potrebbe accadere se l'IA perdesse il controllo e cercasse di eliminare o schiavizzare l'umanità. Ma queste storie non sono basate sulla realtà. La parvenza di intelligenza che vediamo in cose come ChatGPT è un atto impressionante, ma ha poco in comune con il ragionamento astratto e l'attività dinamica multi-dominio che associamo all'intelligenza "reale". Sebbene sia quasi impossibile prevedere come andranno le cose, può essere utile pensare all'AGI come a qualcosa di simile a un viaggio nello spazio interstellare: tutti comprendiamo il concetto e apparentemente ci stiamo lavorando, ma allo stesso tempo siamo incredibilmente lontani dal raggiungere niente di simile. E a causa delle immense risorse e delle scoperte scientifiche fondamentali richieste, nessuno ce la farà improvvisamente per caso!

È interessante pensare all'AGI, ma non ha senso chiedere di mettersi nei guai quando, come sottolineano i commentatori, l'IA presenta già oggi minacce reali e consequenziali nonostante i suoi limiti, e anzi in gran parte a causa loro. Nessuno vuole Skynet, ma non c'è bisogno di una superintelligenza armata di armi nucleari per fare danni reali: oggi le persone stanno perdendo il lavoro e cadendo in bufale. Se non riusciamo a risolvere questi problemi, che possibilità abbiamo contro un T-1000?


Principali attori dell'IA

OpenAI

Schermata di benvenuto di ChatGPT

Se c'è un nome familiare in AI, è proprio questo. OpenAI è nata, come suggerisce il nome, come un'organizzazione che intendeva condurre ricerche e fornire i risultati in modo più o meno aperto. Da allora, si è ristrutturata come una società a scopo di lucro più tradizionale che fornisce l'accesso ai suoi progressi nei modelli linguistici come ChatGPT tramite API e app. È guidato da Sam Altman, un miliardario tecnotopico che ha tuttavia avvertito dei rischi che l'IA potrebbe presentare. OpenAI è il leader riconosciuto in LLM, ma conduce anche ricerche in altre aree.

Microsoft

Non sorprende che Microsoft abbia svolto una buona parte del lavoro nella ricerca sull'IA, ma come altre società, ha più o meno fallito nel trasformare i suoi esperimenti in prodotti importanti. La sua mossa più intelligente è stata quella di investire rapidamente in OpenAI, guadagnandosi una partnership esclusiva a lungo termine con la società, che ora alimenta il suo agente di conversazione Bing. Sebbene i propri contributi siano minori e meno immediatamente applicabili, l'azienda ha una considerevole presenza di ricerca.

Google

Conosciuto per i suoi "viaggi verso il nulla", Google in qualche modo ha perso la barca sull'IA anche se i suoi ricercatori hanno letteralmente inventato la tecnica che ha portato direttamente all'attuale esplosione dell'IA: il trasformatore. Ora sta lavorando sodo sui suoi LLM e altri agenti, ma sta chiaramente recuperando dopo aver speso la maggior parte del suo tempo e denaro negli ultimi dieci anni spingendo il concetto obsoleto di "assistente virtuale" AI. Il CEO Sundar Pichai ha ripetutamente affermato che l'azienda si sta allineando fermamente dietro l'intelligenza artificiale nella ricerca e nella produttività.

Antropico

Dopo che OpenAI si è allontanato dall'open source, i fratelli Dario e Daniela Amodei hanno lasciato il gruppo per avviare Anthropic, con l'intenzione di svolgere il ruolo di un'organizzazione di ricerca sull'IA eticamente considerata e aperta. Con la quantità di denaro che hanno a disposizione, sono un serio rivale di OpenAI anche se i loro modelli, come Claude, non sono ancora così popolari o conosciuti.

Stabilità

Controversa ma inevitabile, Stability rappresenta la scuola di implementazione dell'IA open source, fai ciò che vuoi, recuperando tutto su Internet e rendendo disponibili gratuitamente i modelli di intelligenza artificiale generativa che addestra se hai l'hardware per eseguirlo. Questo è molto in linea con la filosofia "l'informazione vuole essere libera", ma ha anche accelerato progetti eticamente dubbi come la generazione di immagini pornografiche e l'uso della proprietà intellettuale senza consenso (a volte allo stesso tempo).

Elon Musk

Per non essere lasciato fuori, Musk ha espresso apertamente le sue paure riguardo all'IA in fuga, così come alcune uve acide dopo aver contribuito all'OpenAI all'inizio ed è andato in una direzione che non gli piaceva. Sebbene Musk non sia un esperto in materia, come al solito, le sue buffonate e i suoi commenti suscitano risposte diffuse (è stato uno dei firmatari della suddetta lettera di "pausa AI") e sta tentando di avviare la propria squadra investigativa.

IMPARENTATO

ISCRIVITI A TRPLANE.COM

Pubblica su TRPlane.com

Se hai una storia interessante su trasformazione, IT, digitale, ecc. che puoi trovare su TRPlane.com, inviacela e la condivideremo con l'intera Community.

ALTRE PUBBLICAZIONI

Attivare le notifiche OK No grazie