Ainult tellijad
Tehisintellekti agendid peaksid olema AI järgmine suur asi, kuid nende täpset määratlust pole. Siiani ei suuda inimesed kokku leppida, mis on AI agent.
Kõige lihtsamal kujul kirjeldatakse tehisintellekti agenti kõige paremini kui tehisintellektil töötavat tarkvara, mis täidab mitmeid töid, mida klienditeenindaja, personalitöötaja või IT-toe töötaja oleks varem võinud teha, kuigi lõpuks võiks kaasata mis tahes ülesannet. Tal palutakse asju teha ja ta teeb neid inimese heaks, ületades mõnikord mitut süsteemi ja ületades lihtsalt küsimustele vastamise. Näiteks tõi Perplexity turule tehisintellekti agendi, mis aitab inimestel puhkuseoste teha (ja see pole ainus). Ja Google teatas oma esimesest AI-agendist nimega Project Mariner, mida saab kasutada lendude ja hotellide otsimiseks, majapidamistarvete ostmiseks, retseptide leidmiseks ja muudeks ülesanneteks.
Tundub piisavalt lihtne. Olukorra teeb aga keeruliseks selguse puudumine. Isegi tehnoloogiahiiglaste seas pole üksmeelt. Google näeb neid ülesandepõhiste abilistena olenevalt tööst: kodeerimisabi arendajatele; aidata turundajatel luua värviskeemi; Aidake IT-professionaalil logiandmeid vaadates probleem leida.
Asana jaoks võib agent tegutseda lisatöötajana, kes hoolitseb määratud ülesannete eest nagu iga hea töökaaslane. Sierra, endise Salesforce'i kaasjuhi Bret Taylori ja Google'i veteran Clay Bavori asutatud idufirma, näeb agentides kliendikogemuse tööriistu, mis aitavad inimestel saavutada tegevusi, mis lähevad palju kaugemale kui möödunud aasta vestlusrobotid, et aidata lahendada keerukamaid probleemikogumeid.
See järjekindla määratluse puudumine jätab ruumi segaduseks selle üle, mida need asjad täpselt tegema hakkavad, kuid olenemata nende defineerimisest aitavad agendid ülesandeid täita automatiseeritud viisil ja võimalikult vähese inimtegevusega.
Glasswing Venturesi asutaja ja juhtivpartner Rudina Seseri ütleb, et see on alles algusaeg ja see võib selgitada kokkuleppe puudumist. Ei ole ühtset määratlust, mis on AI agent. Kõige levinum on aga seisukoht, et agent on intelligentne tarkvarasüsteem, mis on loodud oma keskkonda tajuma, selle üle arutlema, otsuseid ja tegevusi konkreetsete eesmärkide saavutamiseks iseseisvalt vastu võtma,“ rääkis Seseri.
Ta väidab, et nad kasutavad selle saavutamiseks erinevaid AI-tehnoloogiaid. "Need süsteemid sisaldavad erinevaid AI / ML tehnikaid, nagu loomuliku keele töötlemine, masinõpe ja arvutinägemine, et töötada dünaamilistes domeenides iseseisvalt või koos teiste inimagentide ja kasutajatega."
Boxi kaasasutaja ja tegevjuht Aaron Levie ütleb, et aja jooksul, kui tehisintellekt muutub võimekamaks, saavad tehisintellekti agendid inimeste nimel palju rohkem ära teha ja juba on mängus dünaamika, mis seda arengut juhib.
"AI-agentide puhul on mitu komponenti, mis aitavad dramaatiliselt parandada seda, mida AI-agendid lühikeses ja pikas perspektiivis suudavad saavutada: GPU hind/jõudlus, mudeli tõhusus, mudeli kvaliteet ja intelligentsus, AI raamistikud ja infrastruktuuri täiustused," kirjutas Levie.
See on optimistlik vaade tehnoloogiale, mis eeldab kasvu kõigis neis valdkondades, kuigi see ei pruugi olla tõsi. MIT-i robootika pioneer Rodney Brooks märkis ühes intervjuus, et tehisintellekt peab tegelema palju keerulisemate probleemidega kui enamik tehnoloogiaid ja see ei pruugi kasvada nii kiiresti, kui näiteks Moore'i seaduse järgi teadlastel on.
„Kui inimene näeb tehisintellektisüsteemi ülesandeid täitmas, üldistab ta selle kohe sarnastele asjadele ja annab hinnangu tehisintellektisüsteemi pädevusele; mitte ainult esitus selles, vaid konkurents selle ümber, ”ütles Brooks selle intervjuu ajal. "Ja nad on tavaliselt liiga optimistlikud ja seda seetõttu, et nad kasutavad inimese ülesande täitmise mudelit."
Probleem on selles, et süsteemide ületamine on keeruline ja selle muudab keeruliseks asjaolu, et mõnel pärandsüsteemil puudub põhiline API-juurdepääs. Kuigi näeme pidevaid täiustusi, millele Levie viitas, võib tarkvara hankimine juurdepääsuks mitmele süsteemile ja probleemide lahendamisel, mis sellel teel võivad tekkida, osutuda keerulisemaks, kui paljud arvavad.
Kui see nii on, võivad kõik ülehinnata seda, mida AI-agendid peaksid suutma teha. David Cushman, HFS Researchi uurimisjuht, näeb praegust robotite saaki rohkem nagu Asana: assistente, mis aitavad inimestel teatud ülesandeid täita, et saavutada mingi kasutaja määratletud strateegiline eesmärk. Väljakutse seisneb selles, et aidata masinal ettenägematuid olukordi tõeliselt automatiseeritud viisil toime tulla ja me ei ole ilmselt veel kaugel.
"Ma arvan, et see on järgmine samm," ütles ta. "See on koht, kus AI töötab sõltumatult ja tõhusalt mastaapselt. "See on koht, kus inimesed määravad juhised, turvatõkked ja rakendavad mitut tehnoloogiat, et viia inimene silmusest välja, kui kõik on keskendunud inimese ülalpidamisele." Võti on lasta AI-agendil juhtimine üle võtta ja rakendada tõelist automatiseerimist.
Madrona Venturesi partner Jon Turow ütleb, et selleks on vaja luua tehisintellekti agentide infrastruktuur, mis on spetsiaalselt agentide loomiseks loodud tehnoloogiapakk, olenemata nende määratlusest. Blogipostituses kirjeldab Turow kirjeldatud näiteid AI agentidest praegu töötavad ja kuidas neid ehitatakse.
Turowi arvates nõuab tehisintellekti agentide kasvav levik (ja ta tunnistab ka, et määratlus on endiselt pisut tabamatu) tehnoloogiat, nagu iga teine tehnoloogia. "Kõik see tähendab, et meie tööstusel on vaja teha tööd, et ehitada infrastruktuur, mis toetab AI agente ja neist sõltuvaid rakendusi," kirjutas ta artiklis.
„Aja jooksul arutluskäik paraneb järk-järgult, piirimudelid hakkavad juhtima rohkem töövooge ning arendajad tahavad keskenduda toodetele ja andmetele, asjadele, mis neid eristavad. Nad tahavad, et selle aluseks olev platvorm lihtsalt töötaks mastaabi, jõudluse ja töökindlusega.
Veel üks asi, mida meeles pidada, on see, et agentide töötamiseks on tõenäoliselt vaja mitut mudelit, mitte ühte LLM-i, ja see on mõistlik, kui käsitlete neid agente kui erinevate ülesannete kogumit. „Ma arvan, et praegu ei ole ükski suur keelemudel, vähemalt avalikult kättesaadav monoliitne suur keelemudel, suuteline mingi eriala ülesannetega toime tulema. Ma arvan, et nad ei suuda veel teha mitmeastmelist arutluskäiku, mis mind tulevase agendi suhtes tõeliselt erutaks. Ma arvan, et oleme jõudmas lähedale, kuid me pole veel seal,” ütles Fred Havemeyer, Macquarie US Equity Researchi USA tarkvara ja tehisintellekti uuringute juht.
"Ma arvan, et kõige tõhusamad agendid on tõenäoliselt mitme erineva mudeli kogum, millel on marsruutimiskiht, mis saadab päringuid või juhiseid kõige tõhusamale agendile ja mudelile. Ja ma arvan, et automaatne juhendaja, mis delegeerib mingisuguse rolli, oleks midagi huvitavat.
Lõppkokkuvõttes töötab Havemeyeri tööstus selle nimel, et agendid tegutseksid iseseisvalt. "Agentide tulevikule mõeldes tahan ja loodan näha agente, kes on tõeliselt autonoomsed ja suudavad võtta abstraktseid eesmärke ning seejärel täiesti sõltumatult välja mõelda kõik vahepealsed sammud," ütles ta.
Kuid tõsiasi on see, et me oleme nende agentide osas endiselt üleminekuperioodil ja me ei tea, millal jõuame sellesse Havemeyeri kirjeldatud lõppseisu. Kuigi see, mida oleme seni näinud, on ilmselgelt paljutõotav samm õiges suunas, vajame tehisintellekti agentide jaoks siiski mõningaid edusamme, et need töötaksid täna ettekujutatud viisil, ja on oluline mõista, et me pole veel seal.