![](https://www.ifoto.ai/blog/wp-content/uploads/2023/11/article-thumb-23.webp)
Bültene Abone Ol
Aşağıya e-posta adresinizi girin ve bültenimize abone olun
Aşağıya e-posta adresinizi girin ve bültenimize abone olun
Stabil Difüzyon'un yardımıyla yapay zeka tarafından oluşturulan görüntüleri nasıl oluşturacağınızı zaten biliyor olabilirsiniz. Artık yapay zeka tarafından oluşturulan hareketli grafiklerle bu resimlere yeni bir hayat verebilirsiniz. Hoşgeldiniz Stabil Video Difüzyon Bu, statik görsellerinizi dinamik videolara dönüştürmenize yardımcı olabilir. Bu yazıda size bu konuyla ilgili her önemli şeyi anlatacağım. Kararlı Difüzyon Video Üretimi ve onu bir profesyonel gibi nasıl kullanabileceğinizi öğrenin.
Bildiğiniz gibi Stable Diffusion, Stability AI tarafından oluşturulan açık kaynaklı bir AI modelidir. Stabil Difüzyon ile yalnızca metin komutlarını girerek görüntüler oluşturabilirsiniz. Artık Stable Diffusion'ın video sürümüyle görsellerinizi ücretsiz olarak kısa videolara dönüştürebilirsiniz.
Yapay zeka modeli, görüntüyü kaynak kare olarak alır ve yayılma olarak bilinen benzersiz bir teknik kullanarak onun için sonraki kareleri oluşturur. Bu teknik ideal olarak kaynak görüntüye çeşitli ayrıntılar (arka plan veya nesne için) ekleyerek onu bir video haline getirir. Stability AI, modeli sanal olarak veya yerel bir sistemde çalıştırılabilen çok sayıda gerçekçi video ve fotoğrafa dayanarak eğitti.
Etraflı, Kararlı Video Dağıtımı yaratıcı içerikten eğitici içeriğe kadar her türlü videoyu oluşturmanıza yardımcı olabilecek güçlü bir araçtır. Yakın zamanda piyasaya sürülmüş olmasına rağmen model hala geliştirilme aşamasındadır ve gelecekte gelişmesi beklenmektedir.
Şu anda Stable Diffusion'ın video özelliğini iki şekilde kullanabilirsiniz; sisteminize yükleyebilir veya herhangi bir web tabanlı uygulamadan yararlanabilirsiniz.
O zamandan beri Kararlı Difüzyon AI videodan videoya ücretsiz Çözüm açık kaynaklı bir tekliftir ve çeşitli üçüncü taraf araçlar bunu kendi platformlarına entegre etmiştir. Örneğin, web sitesini ziyaret edebilirsiniz: https://stable-video-diffusion.com/ ve fotoğrafınızı yükleyin. Fotoğraf yüklendikten sonra araç otomatik olarak onu analiz edecek ve videoya dönüştürecektir.
Bu kadar! Birkaç saniye içinde çevrimiçi araç, yüklenen fotoğrafa dayalı olarak kısa bir video oluşturacaktır. Videoyu buradan önizleyebilir ve sisteminize indirebilirsiniz.
Daha özelleştirilmiş (ve filtrelenmemiş) sonuçlar elde etmek istiyorsanız, AI modülünü şuradan yüklemeyi de düşünebilirsiniz: Sabit Video Difüzyon sisteminizde. Ancak sürecin biraz teknik olduğunu ve önemli miktarda bilgi işlem kaynağı tüketeceğini bilmelisiniz.
Önkoşullar:
Yukarıdaki gereksinimleri karşıladıktan sonra sisteminizde Python konsolunu başlatabilirsiniz. Artık, Stabil Difüzyonu çalıştırmak için sisteminizde gerekli bağımlılıkları oluşturacak, etkinleştirecek ve kuracak aşağıdaki komutları tek tek çalıştırabilirsiniz.
python3 -m venv venv
kaynak venv/bin/etkinleştir
pip kurulumu -r gereksinimleri.txt
Ortam sisteminizde çalışır hale geldiğinde bir giriş görüntüsü hazırlayabilirsiniz. Bir görseliniz yoksa metin girerek bir görsel oluşturmak için standart Stable Diffusion AI'yi kullanabilirsiniz.
Videoyu oluşturmak için basitçe gezinebilirsiniz. kararlı video difüzyonu sisteminizde yön. Bir giriş görüntüsü kullanarak video oluşturmak için aşağıdaki komutu girmeniz yeterlidir:
python3 scripts/dream.py –ckpt_path ckpt/stable-diffusion.ckpt –image_path input_image.png –prompt “istem metni” –fps 6 –num_frames 100 –augmentation_level 0,5
Lütfen yukarıdaki komutta aşağıdakileri yapmanız gerektiğini unutmayın:
Komut istemini girdikten sonra bir süre bekleyebilirsiniz. Kararlı Difüzyon Video Üretimi işlemesini tamamlar. Süreç daha karmaşıksa Kararlı Difüzyonun sonuçlarını üretmesi biraz zaman alabilir.
Video oluşturma işlemi tamamlandığında, şuraya kaydedilecektir: çıktı adında zaman damgası bulunan dizin.
Bu şekilde kullanabilirsiniz Kararlı Difüzyon AI videodan videoya ücretsiz (veya fotoğraftan videoya ücretsiz) video oluşturma aracı. Sonuçlarda ince ayar yapmak için çeşitli komut istemleri ve giriş ayarlarıyla daha fazla deneme yapabilirsiniz.
Özetle, Kararlı Difüzyon bir Yapay zeka modeli Yüksek kaliteli medya içeriği (fotoğraf ve videolar) oluşturmak için Stability AI tarafından oluşturulmuştur. Önceki modellerinin daha stabil, hatasız gerçekçi görüntüler üreten versiyonudur.
Öte yandan Kararsız Yayılma onun daha yaratıcı ve sınırsız karşılığıdır. Filtrelenmiş görüntülerden oluşan bir veri kümesi üzerinde eğitilen Stable Diffusion'ın aksine, Unstable Diffusion'ın veri kümesi olarak filtrelenmemiş görüntüler bulunur. Bu nedenle Kararsız Yayılım çoğu zaman sonuçlarında hatalara yol açabilir ve gerçekçi olmaktan çok soyut çalışmalar ortaya çıkarabilir.
O zamandan beri Kararlı Video Dağıtımı Halen gelişmekte olduğundan gerçek etkisini tahmin etmek zordur ancak aşağıdaki etkiye sahip olabilir:
Bildiğiniz gibi Stable Diffusion, videoları saniyeler içinde oluşturabiliyor ve bu da içerik oluşturucuların zamandan tasarruf etmesine yardımcı olabiliyor. Düzenlemeye saatler harcamak yerine animasyonlar oluşturabilir, özel efektler ekleyebilir veya videoların stillerini anında aktarabilirsiniz.
Video düzenlemeye gösterdiğimiz manuel çabalar pahalı ve zaman alıcı olabilir. Diğer taraftan, Kararlı Video Dağıtımı post prodüksiyon görevlerinin çoğunu otomatikleştirerek bu düzenleme maliyetlerini azaltmanıza yardımcı olabilir.
İçerik oluşturucular artık Stabil Difüzyon ile sınırlı yaratıcılıklarının ötesinde videolar üretebilecek. Örneğin gerçekçi özel efektlere sahip videolar oluşturmak veya hareketsiz görüntüleri canlandırmak için kullanılabilir.
Yukarıda tartıştığım gibi Stable Diffusion, herkesin ücretsiz olarak kullanabileceği açık kaynaklı bir araçtır. Bu da onu, becerileri veya bütçesi ne olursa olsun video oluşturmak isteyen herkes için değerli bir yaratıcı varlık haline getiriyor.
Adından da anlaşılacağı gibi yapay zeka modeli, yapay zekayı gerçekçi medya oluşturacak şekilde eğiten bir yayılma uygulamasına dayanıyor. Üç ana prensibe dayanmaktadır:
Difüzyon: Yayılmada önce rastgele bir görüntüyle başlarız ve ardından yavaş yavaş ona daha fazla ayrıntı eklemeye devam ederiz. İlk girdiyle eşleşene kadar farklı çıktılar sağlamaya devam edecektir. Bu eğitecek Kararlı Difüzyon Video Üretimi ilkine dayanarak sentetik çerçeveler bulmak.
Eğitim: Tıpkı tek bir görüntü gibi, yayılma modeli de çok büyük bir veri kümesi üzerinde eğitilir. Bu sayede yapay zeka modeli her türlü gerçekçi nesneyi kolaylıkla ayırt edip üretebiliyor.
Video oluşturma: Model eğitildikten sonra kullanıcılar yapay zeka modeline bir görüntü yükleyebilir. Model, her kare için gürültüyü iyileştirecek ve renkler, döndürmeler, görsel kaymalar vb. için sağlanan girdilere dayalı olarak gerçekçi çıktılar üretecek.
Kararlı Video Dağıtımı yeni yayınlandı ve aşağıdakiler de dahil olmak üzere çeşitli sınırlamalara sahip:
İyi haber şu ki, mevcut yapay zeka modeli Kararlı Video Dağıtımı ücretsiz olarak mevcuttur. Stability AI'a göre modeli şu an itibariyle araştırma amaçlı geliştirdi. Modelin koduna GitHub sayfasından buradan ulaşabilirsiniz: https://github.com/Stability-AI/generative-models
Bunun yanı sıra Hugging Face ile ilgili dokümanlara buradan ulaşabilirsiniz: https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt
Stabilite AI'nın kendisi kapsamlı bir araştırma yaptı ve video oluşturma modelini diğer araçlarla karşılaştırdı. Araştırmaya göre Stabil Video Difüzyonu Runway ve Pika Labs gibi modellerle karşılaştırılıyor.
Burada, bu modellerin özelleştirilmiş 3-30 fps hızında 14 ve 25 kare oluşturma konusunda nasıl performans gösterdiğini görebilirsiniz. Stable Diffusion, gerçekçi videolar oluşturma konusunda Google Video Diffusion ve DALL.E ile karşılaştırıldığında daha güçlüdür.
Modeli | Kuvvet | Zayıflık |
Kararlı Video Dağıtımı | Gerçekçi ve tutarlı sonuçlar; durağan görüntülerden kısa videolar için idealdir | Sınırlı uzunluk, kalite farklılıkları, sınırlı yaratıcı kontrol |
Google Video Dağıtımı | Daha uzun videolar oluşturabilir, metinden videoya dönüştürme için iyidir | Hata üretebilir, ince ayar gerektirir (o kadar kararlı değil) |
DALL-E 2 | Son derece yaratıcı ve deneysel | Daha az kararlı olabilir |
Pist ML | Kullanımı kolay ve yeni başlayanlar için iyi | Sınırlı yetenekler ve diğer modeller kadar güçlü değil |
Pika Laboratuvarları | Açık kaynak | Sınırlı kullanıcı tabanı, halen geliştirilme aşamasındadır |
Hayır – şu an itibariyle sonuçları Kararlı Difüzyon video üretimi yalnızca 4 saniyeye kadar sınırlıdır. Ancak bu yapay zekanın gelecek sürümlerinde uzun süreli videolar da oluşturmasını bekleyebiliriz.
İşte koşmak için bazı gereksinimler Kararlı Video Dağıtımı:
Gereklilik | Asgari | Tavsiye edilen |
GPU | 6 GB VRAM | 10 GB VRAM (veya daha yüksek) |
İşlemci | 4 çekirdek | 8 çekirdek (veya üzeri) |
Veri deposu | 16 GB | 32GB(veya daha yüksek) |
Depolamak | 10GB | 20 GB (veya daha yüksek) |
Bunun yanı sıra sisteminize önceden Python 3.10 (veya üzeri) kurmalısınız.
Şu anda Stability AI yalnızca piyasaya sürüldü Kararlı Video Dağıtımı Modelin gelişebilmesi için araştırma amacıyla. Ancak gelecekte yapay zeka modelinin aşağıdaki özelliklerde gelişmesini bekleyebiliriz:
Eminim bu yazıyı okuduktan sonra nasıl olduğunu kolayca anlayabilirsiniz. Kararlı Difüzyon Video Üretimi İşler. Ayrıca, başlangıç için atabileceğiniz bazı hızlı adımları da derledim. Kararlı Video Dağıtımı kendi başına. Yine de şunu unutmamalısınız ki Yapay zeka modeli nispeten yenidir, hâlâ öğrenmektedir ve gereksinimlerinizi tam olarak karşılamayabilir. Devam edin; Stability AI üretken video modelini deneyin ve yaratıcı enerjinizi açığa çıkarmak için denemeler yapmaya devam edin!