Google, Gemini sohbet botu uygulamasının artık hem yapay zekâ tarafından oluşturulan görselleri hem de telefondan ya da bilgisayardan yüklenen görselleri düzenlemeye müsaade verdiğini duyurdu.
Gemini’ya entegre olarak gelen bu yerleşik (uygulama içi) görsel düzenleme özelliği, bugünden itibaren kademeli olarak kullanıma sunulmaya başlandı. Önümüzdeki haftalarda ise bu özellik birçok ülkede kullanılabilir hale gelecek ve 45’ten fazla lisanı destekleyecek.
Gemini görselleri düzenlemeye müsaade verecek
Yeni güncelleme Google’ın mart ayında AI Studio isimli platformunda test ettiği yapay zekâ görsel düzenleme modelinin devamı niteliğinde. O periyot bu araçların rastgele bir görseldeki filigranı (watermark) kaldırabilme özelliğiyle gündem olmuştu. Artık ise Gemini’nin bu yeni düzenleme aracı, tıpkı ChatGPT’nin yakın vakitte tanıttığı düzenleme aracı üzere, bağımsız çalışan yapay zekâ görsel üreticilerine kıyasla çok daha başarılı sonuçlar sunma potansiyeli taşıyor.
Yeni Gemini özelliği, her komutta görsel ve metni birlikte işleyebilen çok adımlı bir düzenleme süreci olarak karşımıza çıktı. Google, bu bilhassa birlikte “daha güçlü ve bağlama uygun” cevaplar sunduğunu belirtti. Kullanıcılar artık görsellerin art planını değiştirebiliyor, nesneleri öbür öğelerle değiştirebiliyor, yeni ayrıntılar ekleyebiliyor ve daha fazlasını kolay kolay yapabiliyor.
Google ise şu örnekleri paylaştı: “Örneğin, şahsî bir fotoğrafı yükleyip Gemini’den farklı saç renkleriyle nasıl göründüğünü gösteren bir görsel oluşturmasını istemek mümkün. Ya da ejderhalar hakkında bir uyku öyküsünün birinci taslağını hazırlatıp, bu kıssaya eşlik edecek görseller üretmesini sağlamak da.”
Google’ın bahsettiği bu örnekler kulağa deepfake (sahte görsel ya da görüntü üretimi) riskini çağrıştırdıysa bu bahiste da bir açıklama yaptı. Gemini ile oluşturulan yahut düzenlenen tüm görsellere görünmez bir filigran yerleştirdiğini belirtti. Tüm Gemini üretimi görsellerde görünür filigran kullanımını da test etmeye başladığını duyurdu.