Spanish English French German Italian Portuguese
Social marketing
CasaBigTechAmazonAnthropic afferma che i suoi nuovi chatbot AI superano GPT-4

Anthropic afferma che i suoi nuovi chatbot AI superano GPT-4

La startup AI Anthropic, sostenuta da Google e da centinaia di milioni di capitale di rischio (e forse presto altre centinaia di milioni), ha annunciato l'ultima versione della loro tecnologia GenAI, Claude. E l'azienda afferma di superare il chatbot di OpenAI, GPT-4, in termini di prestazioni.

Claude 3, come viene chiamata la nuova GenAI di Anthropic, è una famiglia di modelli: Claude 3 Haiku, Claude 3 Sonnet e Claude 3 Opus, di cui Opus è il più potente. Tutti mostrano "maggiori capacità" di analisi e previsione, affermazioni di Anthropic, nonché prestazioni migliorate su benchmark specifici rispetto a modelli come ChatGPT e GPT-4 (ma non GPT-4 Turbo) e Gemini 1.0 Ultra di Google (ma non Gemini 1.5 Pro). ). .

In particolare, Claude 3 è la prima GenAI multimodale di Anthropic, il che significa che può analizzare sia testo che immagini, in modo simile ad alcune versioni di GPT-4 e Gemini. Claude 3 può elaborare fotografie, tabelle, grafici e schemi tecnici, estraendo file PDF, presentazioni e altri tipi di documenti.

Con un passo migliore rispetto ad alcuni rivali GenAI, Claude 3 può analizzare più immagini in un'unica richiesta (fino a un massimo di 20). Ciò consente di confrontare e contrastare le immagini, osserva Anthropic.

Ma l'elaborazione delle immagini di Claude 3 ha dei limiti.

Anthropic ha impedito ai modelli di identificare le persone, senza dubbio diffidenti nei confronti delle implicazioni etiche e legali. E l'azienda ammette che il Claude 3 è soggetto a errori con immagini di “bassa qualità” (meno di 200 pixel) e ha problemi con compiti che coinvolgono il ragionamento spaziale (ad esempio, leggere il quadrante di un orologio analogico) e il conteggio degli oggetti. Claude 3 non può fornire dati esatti). conteggio degli oggetti nelle immagini).

Credits: Antropico

Nemmeno Claude 3 genererà un lavoro d'arte. I modelli analizzano rigorosamente le immagini, almeno per ora.

Che si tratti di testo o immagini, Anthropic afferma che i clienti possono aspettarsi che Claude 3 segua meglio le istruzioni in più passaggi e produca risultati strutturati in formati come JSON e conversare in lingue diverse dall'inglese rispetto ai loro predecessori. Claude 3 dovrebbe anche rifiutarsi di rispondere alle domande meno frequentemente grazie a una "comprensione più sfumata delle richieste", afferma Anthropic. E presto, i modelli citeranno la fonte delle loro risposte alle domande in modo che gli utenti possano verificarle.

"Claude 3 tende a generare risposte più espressive e coinvolgenti", scrive Anthropic in un articolo di supporto. “È più facile guidare e indirizzare rispetto ai nostri modelli legacy. Gli utenti dovrebbero scoprire di poter ottenere i risultati desiderati con istruzioni più brevi e concise”.

Alcuni di questi miglioramenti provengono dal contesto ampliato di Claude 3.

Il contesto di un modello, o finestra di contesto, si riferisce ai dati di input (ad esempio, testo) che il modello considera prima di generare risultati. I modelli con finestre di contesto piccole tendono a “dimenticare” il contenuto anche di conversazioni molto recenti, portandoli ad allontanarsi dall’argomento, spesso in modi problematici. Come ulteriore vantaggio, i modelli ricchi di contesto possono catturare meglio il flusso narrativo dei dati che ricevono e generare risposte contestualmente più ricche (almeno ipoteticamente).

Anthropic afferma che Claude 3 supporterà inizialmente una finestra di contesto di 200.000 token, equivalenti a circa 150.000 parole, e che i clienti selezionati riceveranno una finestra di contesto di 1 milione di token (~700.000 parole). Questo è alla pari con il modello GenAI più recente di Google, il Gemini 1.5 Pro menzionato sopra, che offre anche una finestra contestuale fino a un milione di token.

Ora, solo perché Claude 3 è un aggiornamento di ciò che è venuto prima non significa che sia perfetto.

In uno documento tecnico, Anthropic ammette che Claude 3 non è immune ai problemi che affliggono altri modelli GenAI, vale a dire pregiudizi e allucinazioni (cioè inventare cose). A differenza di alcuni modelli GenAI, Claude 3 non può effettuare ricerche sul web; i modelli possono rispondere solo a domande utilizzando dati precedenti all’agosto 2023. E sebbene Claude sia multilingue, non parla fluentemente alcune lingue “a basso reddito” come l’inglese.

Ma nei prossimi mesi sono attesi promettenti aggiornamenti da parte di Anthropic per Claude 3.

"Non crediamo che l'intelligenza del modello sia vicina ai suoi limiti e prevediamo di rilasciare miglioramenti alla famiglia di modelli Claude 3 nei prossimi mesi", scrive l'azienda in una nota. post sul blog.

Opus e Sonnet sono ora disponibili sul Web e tramite l'API e la console di sviluppo di Anthropic, la piattaforma Bedrock di Amazon e Vertex AI di Google. L'Haiku seguirà entro la fine dell'anno.

Ecco la ripartizione dei prezzi:

  • Opus: $ 15 per milione di token in entrata, $ 75 per milione di token in uscita
  • Sonetto: 3 dollari per milione di gettoni in entrata, 15 dollari per milione di gettoni in uscita
  • Haiku: 0,25 $ per milione di token in entrata, 1,25 $ per milione di token in uscita

Quindi questo è Claude 3. Ma cos'è la vista a volo d'uccello?

L'ambizione di Anthropic è creare un algoritmo di prossima generazione per l'"autoapprendimento dell'intelligenza artificiale". Un simile algoritmo potrebbe essere utilizzato per creare assistenti virtuali in grado di rispondere a e-mail, condurre ricerche e generare arte, libri e altro ancora, alcuni dei quali sono già stati testati con aziende come GPT-4 e altri grandi modelli linguistici.

Anthropic accenna a questo nel suddetto post sul blog, affermando che prevede di aggiungere funzionalità a Claude 3 che ne migliorino le capacità pronte all'uso consentendo a Claude di interagire con altri sistemi, codificare "in modo interattivo" e offrire "agenti avanzati" capacità”. .”

Quest’ultimo punto ce lo ricorda comunicazionedi OpenAI che mira a creare un agente software per automatizzare attività complesse, come il trasferimento di dati da un documento a un foglio di calcolo o il completamento automatico delle note spese e l'inserimento in un software di contabilità (ad esempio). OpenAI offre già un'API che consente agli sviluppatori di creare "esperienze simili ad agenti" nelle loro app e, secondo quanto riferito, Anthropic intende offrire funzionalità simili.

Potremmo vedere un imager antropico la prossima volta? Sarebbe sorprendente. I generatori di immagini sono oggi oggetto di molte controversie, principalmente per ragioni legate al copyright e ai pregiudizi. Recentemente, Google è stata costretta a disabilitare il suo generatore di immagini dopo aver iniettato diversità nelle immagini con un ridicolo disprezzo per il contesto storico. E diversi venditori di imager sono impegnati in battaglie legali con artisti che li accusano di trarre profitto dal loro lavoro addestrando GenAI in quel lavoro senza offrire compensi o crediti.

Sarà interessante vedere l'evoluzione della tecnica di Anthropic per l'addestramento della GenAI, "AI costituzionale", che secondo l'azienda rende il comportamento della sua GenAI più facile da comprendere, più prevedibile e più facile da regolare secondo necessità. L’intelligenza artificiale costituzionale mira a fornire un modo per farlo allineare l’intelligenza artificiale con le intenzioni umane, facendo in modo che i modelli rispondano a domande ed eseguano attività utilizzando un semplice insieme di principi guida. Ad esempio, per Claude 3, Anthropic ha affermato di aver aggiunto un principio, basato sul feedback del crowdsourcing, che istruisce i modelli a essere comprensivi e accessibili alle persone con disabilità.

Qualunque sia la fine di Anthropic, sarà a lungo termine. Secondo una presentazione trapelata nel maggio dello scorso anno, la società mira a raccogliere fino a 5.000 miliardi di dollari nei prossimi 12 mesi, che potrebbero essere la base di cui ha bisogno per rimanere competitiva con OpenAI. Dopotutto, i modelli di formazione non sono economici. È in arrivo, con 2 miliardi e 4 miliardi di dollari di capitale impegnati rispettivamente da Google e Amazon, e più di un miliardo combinato da altri sostenitori.

IMPARENTATO

ISCRIVITI A TRPLANE.COM

Pubblica su TRPlane.com

Se hai una storia interessante su trasformazione, IT, digitale, ecc. che puoi trovare su TRPlane.com, inviacela e la condivideremo con l'intera Community.

ALTRE PUBBLICAZIONI

Attivare le notifiche OK No grazie