[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content

nokt-ai/Rehber

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 

Repository files navigation

GPTürkiye Midjourney Prompt Rehberi

Giriş

Dil Engelini Aşmak

Başlangıç

___/imagine

___/info

___Arayüz

Çözünürlük Arayüzü

___Varyant Alma

___Hafif & Detaylı Yükseltme

___Beta Sürümü Yükeltme

___Şaşırt Beni

Sonuçların Karşılaştırılması

Sırada Ne Var?

Bize Katılın!

Topluluğumuz

Giriş

Yazdığınız metni görsele dönüştüren yapay zeka Midjourney için bir başlangıç rehberi olmayı hedefleyen bir yazı hazırladık. Karşılığında yazılı ya da görsel bir cevap aldığımız ve yapay zekayı yönlendirmeye çalıştığımız girdiler, ya da “prompt”lar, yapay zekalar arasında benzerlik gösterdiği kadar farklılık da gösterebiliyor. Amacımız, paylaştığımız bilgilerle sadece Midjourney kullanımında değil, tüm yapay zekalara verdiğiniz prompt’ların iyileşmesinde katkı sağlamak.

Midjourney Resmi Dokümantasyonu, Midjourney kullanımına dair tüm kuralları içeriyor. Burada bunları sadeleştirip aşamalandırdık. Bu rehberi güncelledikçe Midjourney dokümantasyonundan Türkçe çevirilerini eklediğimiz kadar kendi tavsiyelerimizi de çeşitlendireceğiz.

Dil Engelini Aşmak

Yapay zekaların çoğunluğu kendilerine Türkçe verilen prompt’ları anlamakta pek güçlük çekmeyip, çoğu zaman da zorlanmadan Türkçe cevap verebilmektedirler. ChatGPT, Midjourney gibi en sık kullanılan yapay zekalar her ne kadar bu koşulları karşılayabilseler de kavrayışlarının eksik, Türkçelerinin de hantal ve gündelik konuşma dilinden uzak olduğunu görüyoruz. Beslendiği kaynakların ağırlığı Türkçe olmayan her yapay zeka, aynı sorunu yaşayacaktır.

Midjourney Türkçe promptları pekala kabul eder, çoğunlukla da ne kast edildiğini aşağı yukarı doğru tahmin etmiş olur. Ancak hem birçok kelimeyi doğru anlayamaz, hem de kavrayış eksikliğini önyargılı davranarak telafi etmeye çalışır. İngilizce her kelimeyi anladığı için bir kavrayış eksikliği yaşamaz. Bu yüzden de bir prompt yeteri kadar detaylıysa, asla özellikle İngiliz ve Amerikan kültüründen beslenmez. Gelgelelim, Midjourney kendisine verilen her Türkçe kelimeyi anlayamadığı, ve kendisine Türkçe, Türkiye hakkında verilen örnekler eksik kaldığı için çok basit bir prompt’ta bile sorun çıkartabiliyor. Sizin için birkaç örnek hazırladık.

Prompt: Çay içen yaşlı kadın, balkon, apartman, gökyüzü, detaylı, gerçekçi, fotoğrafik

Alt text

Prompt: Old woman drinking tea, balcony, apartment, sky, detailed, realistic, photographic

Alt text

Burada dikkat çeken iki unsur var. Birincisi, Türkçe verilen prompt’ta özellikle “yaşlı” dememize rağmen hiç yaşlı bir kadın görmüyor olmamız. Oysa ki İngilizce halinde dört denemede de yaşlı bir kadın olduğunu görüyoruz. İkinci unsur ise, ki duruma göre bu faydalı dahi olacak bir özelliktir, Türkçe verilen prompt’lara Midjourney’nin özellikle Türkiye’den esinlenerek bir estetik kurgulamasıdır. Soldaki fotoğrafta bulunan evler Türkiye’yi anımsatıyor, öyle ki bir tanesinde İstanbul Boğazı’nı görmek bile mümkün.

Prompt: Modern iş adamı, sokaklar, kalabalıklar

Alt text

Prompt: Modern businessman, streets, crowds

Alt text

Türkçe halinde bir “iş adamı”nı bile kavrayamadı, bunun yerine sokaklara odaklandı ve serbest bir çağrışımda bulunup kasaba evleri çizdi. Buradaki bir istisna, sol üstte yer alan ve göl, dağlar, tekne gibi prompt’tan alakasız nesneler içeren deneme. Midjourney, sanki bir film ya da albüm kapağı tasarlar gibi bir başlık atmaya bile çalışmış. Bu, İngilizce dışında bir dil kullanırken olağandışı bir olay değil. Biraz daha incelersek:

Prompt: kravatlı adam, sokaklar, kalabalık

Alt text

Prompt: modern şirket çalışanı, sokaklar, kalabalık

Alt text

İstediğimiz sonuçtan giderek uzaklaşıyoruz. Midjourney de kavrayışının el vermediği noktalarda giderek emin olduğu şeyler üzerine yoğunlaşıp, prompt’un geneline karşı tepkisiz hale geliyor. Sol yukarıdaki prompt için sadece ikisinde bir “adam” çiziyor, bunlardan birini ucundan “Türk” olarak yorumluyor. Hepsinin altında (muhtemelen Midjourney’e verilen örneklerin çoğunluğunu oluşturan) posterlerden, albüm kapaklarından, reklamlardan esinlenilmiş başlık niteliğinde yazılar görülüyor. Prompt’u biraz daha detaylandırdığımızda işler çığırından çıkıyor:

Prompt: Sahil kasabası, festival, akdeniz, açık hava, günbatımı, realistik, detaylı, fotorealistik, 35mm lens — ar 3:2 — chaos 65

Alt text

Prompt: beach town, festival, Mediterranean, clear sky, sunset, realistic, detailed, photorealistic, 35mm lens — ar 3:2 — chaos 65

Alt text

Eğer prompt’ları istediğimiz biçimde İngilizce’de düşünmekte zorlanıyorsak, DeepL gibi bir tercüman kullanarak istediklerimizi Midjourney’e aktarabiliriz. Bu rehberde aktarmaya çalıştığımız prompt yazım mantığına uyulduğu takdirde, Midjourney kendisine veirlen Türkçe’den çevrilmiş İngilizce prompt’ları yorumlamakta güçlük çekmeyecektir. Midjourney kullanmak için katılacağınız Discord kanalında da beğendiğiniz görsellerin prompt'larını DeepL aracılığıyla Türkçe'ye çevirebilir, prompt mantığına biraz daha hakim olabilirsiniz.

Başlangıç

/imagine

Midjourney’de her prompt /imagine yazılarak başlar. Discord, bunu yazıp bir boşluk bıraktığınız anda bunu şöyle tamamlar:

Alt text

“Prompt” kelimesinin içinde bulunduğu kutucuğa yazdığımız her şey, Midjourney tarafından prompt olarak kabul edilir ve yorumlamaya dahil olur. Süreç şöyle özetlenebilir:

  1. /imagine yazılır ve boşluk tuşuna basılır. Bir kutucuk oluşur.
  2. İstenilen prompt yazılır: Örneğin: Dogs running by the beach, ocean, ships (“Kumsalda koşan köpekler, okyanus, gemiler”)
  3. Enter’a basılır.

/info

/fast ve /relax yazarak kullanım modunu değiştirebilir, /info ile de kullanım süreniz gibi hesap detaylarına ulaşabilirsiniz.

Eğer “fast” (hızlı) modu kullanıyorsanız, Midjourney prompt’a vereceği cevabı en fazla 60 saniye içerisinde oluşturur. Şayet “relax” (rahat) modu kullanıyorsanız, bu Midjourney yoğunluğuna göre daha uzun sürebilir.

Arayüz

Midjourney, kendisine verdiğimiz her prompt için dört farklı görsel oluşturur. Bize cevap verdiğinde cevabının şöyle bir formatı olacaktır:

Prompt: Exploring the deep space, Kandinsky style painting, black hole, photon beams, relativity — v 1 ( “Uzayın derinliklerini keşfetmek, Kandinsky tarzı resim, kara delik, foton ışınları, izafiyet — v 1” )

Alt text

U1 ; U2 ;U3 ; U4 (“Upscaling”):

Numaralandırılmış görselin çözünürlüğünü arttırır. Beğendiğimiz bir görseli kaydetmeden evvel Upscaling uygulamak tavsiye edilir.

V1 ; V2 ; V3 ; V4 (“Variation”):

Numaralandırılmış görselin bir varyantını alır. Eğer yorumlamalardan bir tanesini özellikle beğendiyseniz varyant aldığınızda elde edeceğiniz dört yeni görsel, burada seçtiğiniz görsele tarz ve içerik olarak yakından benzeyecektir.

Son olarak şayet hiçbir yorumlamadan memnun kalmadıysak, sağ alttaki 🔁 tuşuna bastığımızda bize aynı prompt’u baştan yorumlayacak ve dört yeni görsel sunacaktır.

Midjourney’de aklımızdaki görsele en yakın yorumlamaya ulaşmak için, yazdığımız prompt’larda değişiklik yaptığımız kadar varyant almamız gerekebiliyor. Midjourney’in bize sunduğu dört yorumlamadan sonra prompt değişikliği ve varyantlar üzerinden paralel aramalar yürütmüş oluyoruz. Örneğin bir varyant daha soyut ve estetik bir yorumlama üzerinden gidiyor, başka bir varyantı ise belki de çok istediğimiz bir detayı yakaladığı için elimizde tutuyor, varyant alarak da diğer detayları tamamlamasını umuyoruz.

/relax komutunun en büyük faydası da burada ortaya çıkıyor. Eğer acelemiz yoksa, ve bolca aramayı paralelde yürütüp elde ettiğimiz yorumlamaları detaylı incelemek istiyorsak, /relax modda çalışıp biraz vakitten fedakarlık edip fotoğraf üretme hakkımızdan kazanıyoruz. Özellikle de başka bir iş ile meşgulsek, bu modda çalışıp örneğin beş dakikada bir Midjourney’e bakmak süreci keyifli olduğu kadar verimli hale getirebiliyor.

Elimizdeki sorgular biriktiğine göre, çözünürlük arttırmak ve son rötuşları atmaya geçebiliriz.

Çözünürlük Arayüzü

Herhangi bir fotoğraf için Upscaling yaptığımızda, örneğin U2 tuşuna bastığımızda, Midjourney bize yine moda göre 60 saniye, ya da daha uzun bir süre sonra, istediğimiz görselin daha yüksek çözünürlükteki bir halini verecektir. Yeni görselimizde yeni birkaç seçenek eklenir.

Prompt: Ancient Egypt, wide view of the Nile River, barges on the river, fishermen, Nile coastline, desert haze, oil painting, desert vegetation — ar 16:9 ( “Antik Mısır, Nil Nehri’nin geniş görünümü, nehirdeki mavnalar, balıkçılar, Nil kıyı şeridi, çöl pusu, yağlı boya, çöl bitki örtüsü — ar 16:9” )

Alt text

Varyant Alma

Make Variations, Görselin şu anki halinin varyantını alır ve dört yeni görsel oluşturur, V3 gibi V-tipi tuşlarla aynı mantıkta çalışır.

Beğendiğimiz bir yorumlamayı çeşitlendirmek için varyant almadan evvel sabretmek daha akıllıca olabilir. Eğer bu görselin detaylarını çeşitlendirirsek, ve bu halinin varyantlarını alırsak, o halde Midjourney istediğimiz yorumlamaya daha çabuk bile ulaşabilir.

Hafif & Detaylı Yükseltme

Light Upscale Redo, Görselin çözünürlüğünü yükseltmeden, ebatı aynı bırakarak detaylarını çeşitlendirir (Beta Upscale Redo’nun tam tersi gibi işler). Bu seçeneğe tıkladığımızda karşımıza yeni bir seçenek daha çıkar:

Alt text

Detailed Upscale Redo, Light Upscale Redo ile detaylandırılmış bir görselin çözünürlüğünü de yükseltir.

Beta Sürümü Yükseltme

Görselin detaylarını çeşitlendirmeden çözünürlüğünü yükseltir (Light Upscale Redo’nun tam tersi gibi işler).

Şaşırt Beni

Midjourney’in test sürümlerine başvurarak görseli tekrar yorumlar. Ne yapacağı hiç belli olmayabilir.

Alt text

Remaster’ladığımız görsel aslında ana içerik olarak yukarıdaki yorumlamalarla çok benzeşiyor. Fakat “içerik” diye yorumladıklarımız, yani gemi, balıkçılar, nehir, çöl havası gibi nesnelere farklı bir dokunuş getiriliyor. Remaster bize tek bir sonuç verir (ve bir tam sorgu hakkı kullanır), bu yüzden varyant almak için biraz masraflı olabilir.

Sonuçların Karşılaştırılması

Demin ele aldığımız Nil Nehri örneği üzerinden devam edelim. Görselleri tam çözünürlükte incelemek için üstlerine tıklamayı unutmayın:

Alt text

Dört yorum arasından birini seçip Upscale yaptığımız başlangıç görseli

Alt text

Light Upscale Redo

Alt text

Detailed Upscale Redo

Alt text

Beta Upscale Redo

Alt text

Beta Upscale Redo + Remaster

Alt text

Detailed Upscale Redo + Remaster

Midjourney’de aynı görsel üzerinden saatler boyu farklı yorumlamalar türetilebilir. Başlangıçta hiç aklımızda olmayan bir estetik dokunuşu Midjourney kendi denemelerinden birinde bize sunabilir. Ne kadar fazla denersek, ne kadar varyant alırsak, ne kadar prompt’ları çeşitlendirip farklı açılardan yaklaşırsak sadece istediğimiz sonuçlara değil, istediğimizin farkında olmadığımız sonuçlara da bir o kadar hızlı ulaşırız.

Prompt’ları sadeleştirmek için bazı kavramları daha genel sunup yorumlamasını Midjourney’e bırakmak, yanlış yorumlarsa da birkaç defa daha denettirmek doğru olabilir. Örneğin, eğer “atın üstünde giden kılıçlı adam” yazmak yerine “şövalye” yazarsak, hem onun “şövalye”den daha zengin çağrışımlar elde etmesini sağlayabiliriz, hem de daha kısa tuttuğumuz için prompt’un devamının kavranmasını kolaylaştırız. Başka bir örnek, “Uçsuz bucaksız enginlere at süren üzgün adam” yazmak yerine “Üzgün binici, ufuk, sonsuzluk” yazmak daha faydalı olacaktır. Eğer daha soyut bir görsel istiyorsak “rüya, hayal” gibi kelimeler seçebiliriz. Eğer bir albüm kapağına benzemesini istiyorsak, “albüm kapağı tasarımı” gibi eklentilerde bulunabiliriz.

Sırada Ne Var?

Prompt’ları sadeleştirmek, çeşitlendirmek, detaylandırmak, deneyebilmek ve eleyebilmek tek bir doğru yola sahip olaylar değiller. Deneme yanılma yöntemiyle her gün binlerce insan diğerleriyle bulgularını paylaşsa da, bunun en iyi yöntemi her zaman kullanıcının kendi denemeleri sonucunda benzerlik ve farklılıkları tespit edip, önündeki yapay zekayı ona göre eğitmesidir.

Rehberin devamında prompt sadeleştirme hakkında birçok örnek paylaşıp hangi durumda hangi prompt taslaklarını kullanabileceğiniz hakkında örnekler sunacağız.

Midjourney’in geçmiş versiyonları hala erişime açık olduğu için, ve her biri farklı kurallarla işlediği için, istediğimiz görselin soyutluk seviyesine göre farklı versiyonların kullanımını göstereceğiz. Bu versiyonlarda farklı estetik seçenekler de olduğu için bir prompt’u sabit tutup hem versiyonunu, hem versiyonun özel ayarlarını, hem de genel parametreleri değiştirerek paralelde onlarca sorgu yürütmeyi basitleştireceğiz.

Bize Katılın!

Diğer bağlantılarımızı ziyaret edin ve topluluğumuzun bir parçası olun!

https://linktr.ee/gpturkiye

Alt text

ver. 1.0.3