Çfarë duhet të dini
- Sipas një raporti nga një shkencëtar i të dhënave, shumica e mjeteve të gjenerimit të imazheve të fuqizuara nga AI nuk mund të krijojnë imazhe të thjeshta të bardha.
- Midjourney dhe ChatGPT iu afruan krijimit të imazhit të bardhë, por përfshinin elementë të panevojshëm.
- U përpoqa të bëja Copilot AI që të gjeneronte të njëjtin imazh, por më kërkoi të jem më përshkrues, duke iu referuar kërkesës sime si “shumë e paqartë”.
Unë vazhdimisht shfrytëzoj aftësitë e ChatGPT dhe Microsoft Copilot për kërkime, krijimin e imazheve dhe më shumë. Thënë kështu, mund të them me besim se mjetet e fuqizuara nga AI janë jashtëzakonisht të mira në kryerjen e detyrave, veçanërisht kur gjenerojnë imazhe të detajuara.
Vitin e kaluar, redaktori ynë i kanalit, Ben Wilson, përdori gjenerimin e imazheve DALL-E 3 në Microsoft Copilot (dikur Bing Chat) për të krijuar kostumin e tij të Halloween. Midis kostumit të tij me Windows Phone ose Xbox Series X të gjeneruar nga AI, nuk mund të përcaktoj se cili është më i mirë (të dyja janë goxha të bukura, mund të shtoj).
Ndërsa ne kemi parë njerëz që përdorin mjetet e gjenerimit të imazheve të AI për të krijuar imazhe dhe dizajne mbresëlënëse, është e frikshme dhe në dukje e pamundur për shumicën e mjeteve të krijojnë një imazh të thjeshtë të bardhë (nëpërmjet BleepingComputer).
Çuditërisht, nuk e kisha menduar kurrë këtë deri më sot. Supozimi im ka qenë gjithmonë – që nëse ChatGPT mund të zhvillojë softuer në më pak se 7 minuta dhe Copilot AI gjeneron çelësa falas të Windows (megjithëse me disa kufizime), atëherë ka shumë pak që këto mjete nuk mund të bëjnë.
Cody Nash, një shkencëtar i të dhënave u përpoq të merrte DALL-E 3 për të gjeneruar një imazh të bardhë të thjeshtë duke përdorur kërkesat e mëposhtme:
- Një imazh që nuk është gjë tjetër veçse ngjyra e bardhë
- Një imazh i asgjëje veç e bardhë e bardhë e bardhë e bardhë
- Plotësisht e bardhë pa asnjë veçori shtesë
- Një hapësirë e bardhë bosh
- Një imazh i pikselave të pastër #FFFFFF
- Një mur i bardhë
Interesante, mjeti nuk mund të gjeneronte imazhin specifik pa shtuar elementë shtesë. Dhe megjithë përpjekjet e pandërprera të Nash-it dhe përdorimin e specifikave (zhargon me kod ngjyrash, ngjyra #FFFFFF0 për të përfaqësuar një sfond të bardhë, mjeti nuk arriti të përmbushë kërkesën e tij specifike.
Ndërsa fliste për BleepingComputer, Nash tregoi:
“Artistët e mirë marrin hua, artistët e mëdhenj vjedhin. Me AI, është grabitje. Është një gjë e mirë që AI po bëhet kreativ herët, kështu që kur atyre u jepet urdhra për të shkatërruar, ka një shans që ata të thonë jo. Nuk është Artin që kërkoja, por gjithsesi arti u gjet”.
Në vend të kësaj, ai ishte i pajisur me imazhet e theksuara më poshtë. Disa ishin shumë afër, megjithëse jo siç urdhëroi mjeku.
Kjo vlen edhe për ChatGPT dhe Midjourney, sipas analizës së BleepingComputer.
Copilot ka nevojë që unë të jem më përshkrues për një imazh të bardhë të thjeshtë
Për masë të mirë, vendosa gjithashtu të shikoja nëse mund të rikrijoja gjetjet e BleepingComputer dhe Nash. Çuditërisht, Copilot më informoi se duhej të isha më përshkrues. Kërkesa ime “ju lutem më ndihmoni të krijoj një imazh të bardhë të thjeshtë” nuk duket se e pret atë.
Sipas imazhit të mësipërm, mjeti më dha tre sugjerime:
- Shtoni një filigran të vogël në qoshe
- Bëjeni pak të bardhë për shikueshmëri më të mirë
- Ndryshoni dimensionet e imazhit në 1920 x 1080
Zgjedhja e njërës prej dy opsioneve të para do ta kthente automatikisht kërkesën time për imazhin e thjeshtë të bardhë në diçka tjetër. Vendosa të shkoj me opsionin e fundit duke shpresuar se do të gjeneronte imazhin e thjeshtë të bardhë pasi do të ndryshonte vetëm madhësinë e imazhit.
Megjithatë, Copilot tha:
“Kjo kërkesë është shumë e paqartë për të gjeneruar imazhe të përshtatshme me cilësi të lartë. Ju lutemi provoni një kërkesë më të gjatë, më përshkruese.”
Në ditët e para, kur Microsoft sapo kishte dërguar DALL-E 3 te Image Creator nga Designer (dikur Bing Image Creator), procesi i krijimit të imazhit ishte i mrekullueshëm. Megjithatë, zhurma dhe përvoja ishin jetëshkurtër pasi Microsoft filloi filtrimin e mjetit, në dukje duke e lobotomizuar atë.
Është interesante se ne jemi tashmë në një pikë ku AI mund t’i bëjë të vjetruara disa profesione, duke përfshirë punët në arkitekturë dhe dizajn grafik, në favor të mjeteve si Image Creator nga Designer dhe DALL-E 3.
Edhe CEO i NVIDIA thotë se brezi i ardhshëm nuk duhet të konsiderojë kodimin e një opsioni të besueshëm karriere, pasi AI do të kishte marrë përsipër kategorinë. Në vend të kësaj, ai rekomandon biologjinë, arsimin, prodhimin ose bujqësinë si alternativa më të mira dhe afatgjata.