Tarzını tutturmak istediğin bir görsel mi gördün? Tek tıkla prompt'a çevir — ZOOOP'un stil analizcisi

Tarzını tutturmak istediğin bir görsel mi gördün? Tek tıkla prompt'a çevir — ZOOOP'un stil analizcisi

EğitimlerYayınlandı

Bir yapay zeka görsel üreticisi ile vakit geçirmiş herkes şu anı yaşamıştır: Pinterest'te ya da bir arkadaşının portfolyosunda geziniyorsun, ışığı, paleti ve havası tam istediğin gibi bir kareye rastlıyorsun, on dakika sonra hâlâ boş prompt kutusuna bakıyorsun, hiçbirini kelimelere dökemiyorsun.

ZOOOP bu sorun için küçük bir kestirme yayımladı — stil analizcisi: bir referans görsel yükle, birkaç saniye bekle, derli toplu bir İngilizce prompt geri al. Doğrudan kutuya yapıştır ya da göndermeden önce birkaç ifadeyi yeniden yaz.

Stil analizcisi aslında ne yapıyor

Bir cümlede: görseli, modelin okuyabileceği bir prompt'a çevirir.

Analizci görseli birkaç eksene ayırır:

  • Subject (özne) — karede ne var: insanlar, nesneler, sahnenin kendisi
  • Composition (kompozisyon) — açı, mesafe, çerçeveleme, yerleşim
  • Style (stil) — fotoğraf, illüstrasyon, yağlıboya, 3D render, film dokusu vb.
  • Lighting (ışık) — sert mi yumuşak mı, önden mi arkadan mı, sıcak mı soğuk mu
  • Palette (palet) — baskın tonlar, renk ilişkileri, doygunluk
  • Mood (atmosfer) — duygusal kayıt: sakin, gergin, sıcak, yalnız

Sonra tüm bunları ~120 kelimeyle sınırlı tek bir İngilizce paragrafa örer. Neden İngilizce — günümüz görsel modelleri hâlâ İngilizce prompt'lara çok daha ince ayarlı; iyi Türkçe bile örtük çeviri adımında suluyor. Modelin eğitildiği dilde konuşmak çıktıları belirgin biçimde daha kararlı yapar.

Çıktı neye benziyor

Yukarıdaki eksenler gerçek bir görsel üstünde görmeden soyut kalır. "Tokyo'da alacakaranlık, siyah şemsiyeli yalnız bir figür ıslak caddeyi geçiyor, su birikintilerinde neon yansımaları" şeklinde bir fotoğraf yüklediğini düşün. Geri dönen yapılandırılmış sonuç aşağı yukarı şuna benzer:

  • Subject — a lone figure with a black umbrella walking down a rain-slicked street
  • Composition — low-angle shot, centered subject, leading lines from neon signs
  • Style — cinematic photography, subtle film grain, anamorphic flare
  • Lighting — rim lighting from neon, soft ambient fill, cool dominant with warm accents
  • Palette — deep teal and magenta, warm amber highlights from puddles
  • Mood — melancholic, contemplative, urban solitude
  • Camera — 35mm anamorphic lens, shallow depth of field

Hemen altında bir Overall Description bulunur — aynı eksenler kesintisiz bir İngilizce prompt'a örülmüş halde. Aslında üreticinin giriş kutusuna düşen bu paragraftır; yukarıdaki ayrıntılı eksenler daha çok "prompt neden böyle söylüyor" açıklamasıdır, böylece parçaları tek tek seçip düzenleyebilirsin.

Böyle görmenin faydası: bir ekseni tek tek kilitleyebilirsin. Tüm kompozisyon ve atmosferi korumak ama ışığı yumuşak şafak ışığıyla değiştirmek mi istiyorsun? Sadece Lighting satırını değiştir, Overall Description'da karşılık gelen cümleyi güncelle, gerisini olduğu gibi bırak. Sıfırdan yeniden yazmaktan çok daha hızlı.

Nerede bulunur

Stil analizcisi ZOOOP içinde iki yerde görünür:

  1. Herhangi bir üreticinin üstünde — bir yapay zeka görsel üreticisi ya da bir yapay zeka video üreticisi aracını aç, bir referans görsel ekle, prompt kutusunun üstünde bir "Describe style" düğmesi belirir.
  2. Tuvalin içindeüretken tuval prompt çubuğunda aynı düğmeye sahip. Çoklu çekim akışlarında kullanışlı: bir referansı analiz et, aynı görünümü on çekimde yeniden kullan.

Tıkla, birkaç saniye bekle, prompt kutusu kendiliğinden dolar. Olduğu gibi gönder, ya da önce bir ifadeyi düzenle. Bir başlangıç noktasıdır, bitiş çizgisi değil.

Ne zaman başvurmalı (ve ne zaman değil)

Uygun olduğu durumlar:

  • Bayıldığın bir referans gördün ama neden sevdiğini anlatamıyorsun — bunu analizci senin için söylesin.
  • Bir çekim serisinde tutarlı bir görünüm istiyorsun — ilk referansı analiz et, aynı açıklamayı diğer hepsine yapıştır.
  • Prompt yazarken duvara tosladın ve çıkmak için başka bir açıya ihtiyacın var.
  • Bir fotoğrafın veya tablonun görsel dilini yeni bir özneye taşımak istiyorsun — örneğin bir film karesinin atmosferini kendi karakter sahnen üstüne uygulamak.

Doğru araç olmadığı durumlar:

  • Piksel piksel kopyalama. Stil analizcisi stil aktarımı yapar, birebir kopya değil. Mevcut bir görseli sadakatle düzenlemen gerekiyorsa yapay zeka görsel düzenleme kullan.
  • Çok metin içeren görseller. Analizci bilerek görseldeki metni yazıya dökmez — tabelalar, afişler, altyazılar göz ardı edilir. Yanlış okumalardan kaçınmak için kasıtlı yapılmıştır.
  • Tanınabilir gerçek kişiler. Mahremiyet sebebiyle hiçbir isim verilmez, sadece "uzun düz siyah saçlı otuzlu yaşlarda bir kadın" gibi gözlemlenebilir özellikler tanımlanır.

Karşılığını veren birkaç alışkanlık

Prompt yazmak biraz yemek pişirmeye benziyor — kimisi tarifi uygular, kimisi tat aldıkça ayar yapar. Analizci sana tarifi uzatır; ne kadar harfiyen uygulayacağına sen karar verirsin.

Düzenle, körlemesine yapıştırma. Çıktı tek parça bir açıklamadır. Hızla tara; istemediğin bir kısım varsa kes. Analizci "at dusk" yazabilir ama sen "at dawn" istiyordun — tek kelimeyi değiştir.

Kombinasyonlar için ayrı ayrı analiz et. A görselinin ışığı ile B görselinin kompozisyonunu istiyorsan, her birini analizciden tek tek geçir, sonra cümleleri elle birleştir. Modelden ikisini aynı anda görmesini istemekten çok daha kontrollü.

İngilizceyi geri çevirme. Model en iyi performansı doğrudan İngilizce beslendiğinde verir — her kelimeyi okumana gerek yok. Fikrini kontrol etmek için bir çeviriciye sokabilirsin, ama göndermeden önce Türkçeye yeniden yazma.

Bir not

Stil analizcisi her çalıştırma için küçük bir miktar kredi tüketir — rahatça kullanılabilecek kadar hafif — ve başarısız olduğunda otomatik iade eder. Yapay zeka görsel üretimi ve yapay zeka video üretimi ile aynı altyapıda çalışır, dolayısıyla hız ve güvenilirlik ana araçlarla aynı seviyededir.


Tüm bunların dürüst hali: yapay zeka görsel çalışmasındaki darboğaz genellikle model değildir — "aslında ne istediğim" sorusunu yüksek sesle söylemek zordur. Stil analizcisi tam bu adımda yardım eder. Belirsiz bir beğeniyi somut bir tanıma dönüştürür, gerisini modele bırakır.

Bir dahaki sefere hissini yakalamak isteyeceğin bir şeyin önünden geçtiğinde, kelimelere dökmeye çalışmayı bırak. Yapay zeka görsel üreticisine ya da üretken tuvale at, düğmeye bas, ne döndüğüne bak.

Paylaş