TRPlane Clubi kasutajad
Nvidia süveneb maailmamudelitesse: tehisintellekti mudelitesse, mis on inspireeritud maailma vaimsetest mudelitest, mida inimesed loomupäraselt arendavad.
Las Vegases toimuval CES 2025 messil teatas ettevõte, et teeb avalikult kättesaadavaks ülemaailmsete mudelite perekonna, mis suudavad ennustada ja luua "füüsikateadlikke" videoid. Nvidia nimetab seda perekonda Cosmos World Foundation Models või lühidalt Cosmos WFM.
Mudelid, mida saab häälestada konkreetsete rakenduste jaoks, on saadaval Nvidia API ja NGC kataloogides, GitHubis ja Hugging Face AI arendusplatvormis.
"Nvidia teeb Cosmos WFM-i esimese laine kättesaadavaks füüsikapõhiseks simulatsiooniks ja sünteetiliste andmete genereerimiseks," kirjutas ettevõte ajaveebi postituses. "Teadlased ja arendajad, olenemata oma ettevõtte suurusest, saavad vabalt kasutada Cosmose mudeleid Nvidia lubava avatud mudelilitsentsi alusel, mis võimaldab ärilist kasutamist."

Cosmos WFM-i perekonnas on mitu mudelit, mis on jagatud kolme kategooriasse: Nano madala latentsusajaga ja reaalajas rakenduste jaoks, Super suure jõudlusega põhimudelite jaoks ja Ultra maksimaalse kvaliteedi ja täpsuse saavutamiseks.
Mudelite suurus on 4–14 miljardit parameetrit, kusjuures Nano on väikseim ja Ultra suurim. Parameetrid vastavad ligikaudu mudeli probleemide lahendamise võimetele ja rohkemate parameetritega mudelid toimivad üldiselt paremini kui need, millel on vähem parameetreid.
Cosmos WFM osana toob Nvidia turule ka „ülesproovimise mudeli”, videodekoodri, mis on optimeeritud liitreaalsuse ning turva- ja kindlusmudelite jaoks, et tagada vastutustundlik kasutamine, ning mudelid, mis on häälestatud selliste rakenduste jaoks nagu anduritelt andmete genereerimine autonoomsed sõidukid. Neid, nagu ka teisi Cosmos WFM-i mudeleid, õpetati 9.000 triljoni žetooniga 20 miljoni tunni jooksul inimeste, keskkonna, tööstuse, robotite ja autojuhtimise interaktsioonidest, teatas Nvidia. AI-s tähistavad märgid toorandmete bitte; antud juhul videoseeriad.
Nvidia ei öelnud, kust need treeningandmed pärinevad, kuid vähemalt üks aruanne (ja kohtuasi) väidab et ettevõte treenis autoriõigustega kaitstud YouTube'i videotega ilma loata.
Nvidia pressiesindaja ütles kommentaari saamiseks, et Cosmos "ei ole loodud kaitstud teoste kopeerimiseks ega rikkumiseks".
"Cosmos õpib täpselt nii, nagu inimesed õpivad," ütles pressiesindaja. „Et aidata Cosmosel õppida, kogume andmeid erinevatest avalikest ja eraallikatest ning oleme kindlad, et meie andmete kasutamine on kooskõlas nii seaduse tähe kui ka mõttega. Andmed maailma toimimise kohta (mida Cosmose mudelid õpivad) ei ole autoriõigusega kaitstud ega allu ühegi autori või ettevõtte kontrollile.
Jättes kõrvale tõsiasja, et sellised mudelid nagu Cosmos ei õpi tegelikult nii, nagu inimesed õpivad, ütlevad autoriõiguse eksperdid, et sellised väited nagu Nvidia õiglase kasutamise õigusdoktriin ei pruugi kohtulikule kontrollile vastu pidada. See, kas need ettevõtted domineerivad, sõltub suuresti sellest, kuidas kohtud otsustavad, mis on õiglane kasutamine, mis võimaldab autoriõigustega kaitstud teoste kasutamist millegi uue loomiseks seni, kuni see on transformatiivne, ja kehtib AI koolituse kohta.
Nvidia ütles, et teksti- või videokaadritega Cosmos WFM-i mudelid võivad genereerida "juhitavaid ja kvaliteetseid" sünteetilisi andmeid, et alustada muu hulgas robootika, isejuhtivate autode koolitusmudelitega.

"Nvidia Cosmose avatud mudelikomplekt tähendab, et arendajad saavad kohandada WFM-e andmekogumitega, näiteks autonoomsete sõidukite reiside või laos navigeerivate robotite videosalvestustega," kirjutas Nvidia pressiteates. "Cosmos WFM on loodud spetsiaalselt füüsikalise tehisintellekti uurimise ja arendamise jaoks ning suudab luua füüsikapõhiseid videoid sisendite, näiteks teksti, piltide ja video, samuti roboti andurite või liikumisandmete kombinatsioonist.
Nvidia sõnul on sellised ettevõtted nagu Waabi, Wayve, Fortellix ja Uber juba pühendunud WFM Cosmose testimisele erinevatel kasutusjuhtudel, alates otsingust ja videoülevaatest kuni autonoomsete sõidukite tehisintellekti mudelite loomiseni.
"Generatiivne AI juhib mobiilsuse tulevikku, kuna see nõuab rikkalikke andmeid ja väga võimsat andmetöötlust," ütles Uberi tegevjuht Dara Khosrowshahi. "Nvidiaga töötades oleme kindlad, et saame aidata kiirendada ohutute ja skaleeritavate autonoomsete sõidulahenduste ajakava tööstusele."
Oluline on märkida, et Nvidia globaalsed mudelid ei ole "avatud lähtekoodiga" selle kõige rangemas tähenduses. Avatud lähtekoodiga tehisintellekti laialdaselt tunnustatud määratluse täitmiseks peab tehisintellekti mudel andma oma ülesehituse kohta piisavalt teavet, et inimene saaks selle "oluliselt" uuesti luua ja avaldada kõik asjakohased üksikasjad selle treeningandmete kohta, sealhulgas päritolu ja kuidas andmeid saab kasutada. saadud või litsentsitud.
Nvidia ei ole avaldanud Cosmos WFM treeningandmete üksikasju ega teinud kättesaadavaks kõiki tööriistu, mis on vajalikud mudelite nullist taasloomiseks. See on ilmselt põhjus, miks tehnoloogiahiiglane viitab mudelitele pigem avatud kui avatud lähtekoodiga mudelitele.
"Loodame väga, et Cosmos teeb robootika ja tööstusliku AI jaoks sama, mida Llama on ettevõtete heaks teinud," ütles Nvidia tegevjuht Jensen Huang.