Tehisintellekt
Fireflyl, Adobe generatiivsete AI-mudelite perekonnal, ei ole loominguliste seas just kõige parem maine.
Eelkõige Firefly pildistamismudelit on naeruvääristatud pettumus y defektne võrreldes Midjourney, OpenAI DALL-E 3 ja teiste rivaalidega, millel on kalduvus jäsemeid ja maastikke moonutada ning suundades nüansse kaotada. Kuid Adobe üritab laeva parandada oma kolmanda põlvkonna mudeliga Firefly Image 3, mis käivitati Max Londoni konverentsi ajal.
Photoshopis (beetaversioon) ja Adobe Firefly veebirakenduses saadaval olev mudel toodab "realistlikumaid" pilte kui tema eelkäija (pilt 2) ja eelmine mootor (pilt 1), tänu võimele mõista pikemaid ja pikemaid stseene ja viipasid . samuti täiustatud valgustuse ja teksti genereerimise võimalused. Adobe ütleb, et see peaks täpsemalt esindama selliseid aspekte nagu tüpograafia, ikonograafia, rasterpildid ja joonpilt ning on "oluliselt" osavam esindama tihedat rahvahulka ja "üksikasjalike omadustega" ja "erinevaid meeleolusid ja väljendeid".
Pildil 3 saadetud testid nad tunduvad olla samm edasi pildi 2 suhtes.
Pilti 3 ei saa testida. Kuid Adobe PR saatis mudelist mõned tulemused ja sõnumid ning käivitas need samad sõnumid veebis pildi 2 kaudu, et saada näidiseid tulemuste võrdlemiseks pildiga 3. Pange tähele, et pildi 3 tulemused võivad olla hoolikalt valitud.
Pildi 3 valgustust näete pildil 2 võrreldes allolevaga pildil XNUMX:
Pildilt 3. Sõnum: "Uuri portree noorest naisest."
Sama kommentaar, mis eelmine, pildilt 2.
Pildi 3 väljund tundub minu silmadele üksikasjalikum ja realistlikum, varjude ja kontrastiga, mis pildi 2 näidises suures osas puuduvad.
Siin on piltide komplekt, mis näitab pildi 3 stseeni mõistmist:
Pildilt 3. Sõnum: "Kunstnik oma stuudios istub laua taga ja näeb välja mõtlik, palju värve ja eeterlikku."
Sama teade, mis eelmine pildil 2.
Tuleb märkida, et pildi 2 näidis on pildi 3 tulemusega võrreldes üsna elementaarne nii detailsuse kui ka üldise väljendusrikkuse osas. Pildi 3 näidissärgi (ümber vöökoha) subjektiga on segadus, kuid poos on keerulisem kui pildi 2 objektil ja ka pildi 2 riietus on veidi kõrvale kaldunud.
Kindlasti võib osa pildi 3 täiustustest seostada suurema ja mitmekesisema treeningandmete kogumiga.
Nagu pilt 2 ja pilt 1, on ka pilt 3 koolitatud üles laadima Adobe Stocki, Adobe autoritasu tasuta meediumiteeki, koos avaliku domeeni ja litsentsitud sisuga, mille autoriõigused on aegunud. Adobe Stock kasvab kogu aeg ja järelikult ka saadaolev treeningandmete kogum.
Püüdes vältida kohtuasju ja positsioneerida end eetilisema alternatiivina generatiivsetele tehisintellekti tarnijatele, kes treenivad piltidega valimatult (nt OpenAI, Midjourney), on Adobe'il programm, mis maksab Adobe Stocki toetajatele kogu koolitusandmete eest. Programmi tingimused on aga üsna läbipaistmatud. Vastuoluline on see, et Adobe koolitab Firefly mudeleid AI-ga loodud piltidel, mida mõned peavad andmepesu vormiks.
Hiljutine Bloomberg teavitatud et AI-ga loodud paljastatud pilte Adobe Stockis ei jäeta Firefly pildimudelite treeningandmetest välja, on murettekitav väljavaade, arvestades, et need pildid võivad sisaldada autoriõigustega kaitstud materjal. Adobe on seda tava kaitsnud, väites, et AI-ga loodud pildid moodustavad vaid väikese osa tema treeningandmetest ja läbivad modereerimisprotsessi, et tagada, et need ei esinda kaubamärke, äratuntavaid tegelasi ega viidatud kunstnike nimesid.
Muidugi ei taga ei mitmekesised ja "eetilisemalt" allikaga koolitusandmed ega sisufiltrid ja muud kaitsemeetmed täiesti tõrgeteta kogemust: näiteks kasutajad, kes väljendavad tema rahulolematust austa pilti 2. Pildi 3 tõeline proovikivi saabub siis, kui kogukond saab oma käed.
Uued AI-toega funktsioonid
Pilt 3 pakub Photoshopis mitmeid uusi funktsioone peale täiustatud tekstist pildiks teisendamise.
Uus "stiilimootor" pildil 3 koos uue automaatse stiliseerimisvalikuga võimaldab mudelil luua laiemat värvivalikut, tausta ja objekti poose. Nende toiteallikaks on Reference Image, mis võimaldab kasutajatel kohandada mudelit sellisele kujutisele, mille värvide või toonidega nad soovivad, et nende tulevane sisu ühtlustuks.
Kolm uut generatiivset tööriista (Generate Background, Generate Sarnased ja Täiustage üksikasju) kasutavad Image 3 eeliseid piltide täpseks muutmiseks. Generate Background (isekirjeldav) asendab tausta loodud taustaga, mis sulandub olemasolevasse pilti, samas kui Generate Sarnane pakub variatsioone foto valitud osas (näiteks inimene või objekt). Mis puutub detailide täiustamisse, siis see "peenhäälestab" pilte, et parandada teravust ja selgust.
Kui need funktsioonid tunduvad tuttavad, on põhjuseks see, et need on Firefly veebirakenduse beetaversioonis olnud vähemalt kuu aega (ja Midjourney palju kauem). See tähistab selle debüüti Photoshopis, beetaversioonis.
Veebirakendusest rääkides ei jäta Adobe tähelepanuta seda alternatiivset teed oma tehisintellekti tööriistadele.
Pildi 3 väljalaskmisega samaaegselt saab Firefly veebirakendus struktuuriviide ja stiiliviide, mida Adobe esitleb uute viisidena "loomingulise juhtimise edendamiseks". Mõlemad kuulutati välja märtsis, kuid on nüüd laialdaselt saadaval. Rakenduse Structure Reference abil saavad kasutajad luua uusi pilte, mis sobivad võrdluspildi „struktuuriga”, näiteks võidusõiduauto eestvaade. Stiiliviide on sisuliselt stiiliülekanne teise nimega, säilitades pildi sisu (nt elevandid Aafrika safaril), jäljendades samal ajal sihtpildi stiili (nt pliiatsivisand).
Siin on struktuuriviide töös:
Algne pilt.

Transformeeritud struktuuriviitega.
Ja stiiliviide:

Algne pilt.
Transformeeritud stiiliviitega.
Adobe'ilt küsiti, kas kõigi uuendustega Firefly pildistamise hind muutub. Praegu maksab Firefly odavaim lisatasu pakett 4,99 dollarit kuus, alistades konkurentsi nagu Midjourney, 10 dollarit kuus ja OpenAI-d, mis pakub DALL-E 3 20-dollarilise kuus ChatGPT Plusi tellimuse taga.
Adobe ütles, et selle praegused tasemed jäävad praegu kehtima koos selle tasemega generatiivne krediidisüsteem. Samuti teatas ta, et ei muutu ka tema hüvitamispoliitika, mis sätestab, et Adobe maksab Firefly's loodud teostega seotud autoriõiguse nõuded, ega ka lähenemine AI-ga loodud sisu märgistamisele. Sisumandaadid (metaandmed tehisintellektiga loodud meediumide tuvastamiseks) manustatakse jätkuvalt automaatselt kõikidele Firefly kujutiste versioonidele veebis ja Photoshopis, olenemata sellest, kas need on loodud nullist või osaliselt redigeeritud generatiivsete funktsioonide abil.
