Lightricks’in açık kaynaklı yapay zeka videosu 4K, ses ve daha hızlı görüntü oluşturma sunuyor

Date:

Lightricks En yeni suni zeka modeliyle süratli video oluşturma ve yineleme mevzusunda çıtayı yükseltiyor. Şirket, yeni piyasaya sürülen LTX-2 temel modelinin, oynatma hızından daha süratli yeni içerik oluşturabildiğini, ek olarak çözünürlük ve kalite açısından çıtayı yükselttiğini iddia ediyor.

Açık kaynaklı LTX-2, kaliteden taviz vermeden yalnızca beş saniyede stilize, yüksek çözünürlüğünde olan, altı saniyelik bir video oluşturabilir ve yaratıcıların ustalaşmış içinde ne olduğu eskisinden oldukça daha süratli bir halde yayınlamasına olanak tanır.

Bu etkisinde bırakan bir başarı fakat LTX-2’yi ötekilerden ayıran tek parametre bu değil. Şirket, mahalli ses ve video sentezini açık kaynak şeffaflığıyla birleştiriyor ve kullanıcılar yalnızca birkaç saniye daha beklemek isterlerse çıkışlarını saniyede 48 kareye kadar 4K çözünürlüğe yükseltebileceklerini söylüyor. Daha da iyisi, içerik oluşturucular yazılımı tüketici sınıfı GPU’larda çalıştırarak data işlem maliyetlerini mühim seviyede azaltabilir.

Difüzyon modelleri yaşlanıyor

LTX-2, oluşturulan içeriğe aşamalı olarak “gürültü” ilave ederek ve arkasından çıktı, modelin üstünde eğitim almış olduğu video varlıklarına benzeyene kadar bu gürültüyü azaltarak çalışan, yayılma modeli olarak malum bir modeldir.

Lightricks, LTX-2 ile yayılma sürecini hızlandırdı, böylece yaratıcılar neredeyse anında canlı önizlemeler yayınlayarak fikirlerini yineleyebilirler. Model hem de, ister film müziği, diyalog yada ortam sesi efektleri olsun, yaratıcı iş akışlarını mühim seviyede hızlandıran birlikte rol alan sesleri de üretme kapasitesine haizdir.

Bu büyük bir vaka; daha ilkin olduğu şeklinde, içerik oluşturucuların herhangi bir sesi videodan ayrı olarak oluşturması, arkasından bu tarz şeyleri birleştirmek ve muhteşem senkronizasyon olduğundan güvenilir olmak için süre harcanması gerekiyordu. Google’ın Veo modelleri, senkronize ses üretiminin kuvvetli entegrasyonuyla övülüyor; dolayısıyla LTX’teki bu yeni özellikler, Lightricks teknolojisinin son teknolojiyle aynı seviyede olduğu fikrini güçlendiriyor.

Erişim seçenekleri söz mevzusu olduğunda Lightricks, LTX-2 ile içerik oluşturuculara hâlâ bolca oranda esneklik sunuyor. Firmanın amiral gemisi LTX Studio platformu, bazı durumlarda en yüksek kalitede videolar oluşturmak için hızdan birazcık fedakarlık etmeye istekli olan profesyonelleri hedefliyor. Lightricks, bunun arkasından gelen birazcık daha yavaş işlem hızlarıyla, videoları 48 fps’ye kadar mahalli 4K çözünürlükte yayınlayabileceklerini ve beyazperde prodüksiyonlarından beklenen aynı standartta yaratabileceklerini iddia ediyor.

Platform, modelin özelleştirilebilir parametrelerini etkileyen oldukça çeşitli yaratıcı kontroller sunar. Bunlarla ilgili daha çok detay yakında açıklanacak sadece poz ve derinlik kontrolleri, videodan videoya oluşturma ve görüntü oluşturma alternatiflerini içermelidir; bu sonbaharın sonlarına doğru yayınlanma tarihini takip edin.

Lightricks kurucu ortağı ve İcra Kurulu Başkanı Zeev Farbman, LTX-2’nin gelişmiş yeteneklerinin, yayılma modellerinin nihayet ne kadar olgunlaştığını gösterdiğine inanıyor. Yapmış olduğu açıklamada LTX-2’nin şöyleki bulunduğunu söylemiş oldu: “Senkronize ses ve videoyu, 4K standardını, esnek iş akışlarını ve köktencilik verimliliği birleştiren, şimdiye kadar ürettiğimiz en eksiksiz ve kapsamlı yaratıcı suni zeka motoru.”

“Bu buğu yazılımı yada araştırma demosu değil” dedi. “Bu, video oluşturmada gerçek bir atılım.”

Mühim bir dönüm noktası

LTX-2 ile Lightricks, önceki LTXV modellerinde sektördeki bazı ilklerin arkasından gelen platformla suni zeka video üretiminin en ileri noktasında bulunduğunu gösteriyor.

Temmuz ayında, firmanın LTXV-2B ve LTXV-13B’yi de içeren LTXV modelleri ailesi, ilk ürün ailesi oldu. uzun biçimli video oluşturmayı destekleyinçıktıyı 60 saniyeye kadar uzatan bir güncellemenin arkasından geldi. Bununla beraber, AI video prodüksiyonu, kullananların ilk istemle başlayabilmesi ve video canlı olarak yayınlanırken gerçek zamanlı olarak başka istemler ekleyebilmesiyle “hakkaten yönlendirilmiş” hale geldi.

LTXV-13B, bir dakikalık güncellemeden ilkin bile piyasadaki en kuvvetli video oluşturma modellerinden biri olarak esasen biliniyordu. Mayıs ayında piyasaya sürülen bu platform, sektördeki oldukça ölçekli görüntülemeyi destekleyen ilk platformdu; bu platform, tıpkı ustalaşmış animatörlerin geleneksel üretim süreçlerinde çalışmalarının üstüne ek ayrıntıları “katmanlamaları” şeklinde, modelin adım adım daha çok renk ve detay eklemesini sağlayarak kullananların videolarını aşamalı olarak geliştirmelerine olanak tanıyor.

13B modeli eğitildi lisanslı veri Getty ve Shutterstock’tan. Firmanın bu içerik devleriyle olan ortaklıkları yalnızca eğitim verilerinin kalitesi açısından değil, hem de etik nedenlerden dolayı da önemlidir; modellerin çıktıları, öteki birçok suni zeka modelinin yaratımlarını rahatsız eden bir mesele olan telif hakkı açısından oldukça daha azca sorunludur.

Lightricks ek olarak LTXV-13B’nin difüzyon sürecini basitleştiren ve hızlandıran damıtılmış bir versiyonunu da yayınladı; bu, içeriğin dört ila sekiz adım kadar kısa bir sürede oluşturulabileceği anlamına geliyor. Damıtılmış sürüm hem de LoRA’ları da destek sunar; bu, bir projenin güzel duyu tarzına daha uygun içerik oluşturmak için kullanıcılar tarafınca ince ayar yapılabileceği anlamına gelir.

Yenilikçi faturalandırma modelleri

Daha önceki modeller şeklinde LTX-2 de açık kaynak lisansı altında piyasaya sürülecek ve bu da onu Alibaba’nın Wan2 serisi modellerine uygun bir alternatif haline getirecek. Lightricks, bunun yalnızca “açık erişim” yerine gerçek anlamda açık kaynak bulunduğunu altını çizdi; bu, öncesinden eğitilmiş ağırlıkların, veri kümelerinin ve tüm araçların, modelin kendisiyle beraber GitHub’da mevcut olacağı anlamına geliyor.

LTX-2, LTX Studio’daki kullanıcılara sunulmaktadır ve API’si aracılığıyla şu an itibariyle, açık kaynaklı sürümün Kasım ayında piyasaya sürülmesiyle beraber.

Lightricks, API vesilesiyle ücretli sürümü kullanmayı tercih edenler için esnek fiyatlandırma sunuyor; yalnızca beş saniyede HD videolar oluşturan sürüm için maliyetler saniyede yalnızca 0,04 dolardan başlıyor. Pro sürümü hız ile performansı dengeliyor ve burada fiyatlar saniyede 0,07 dolardan başlıyor. Ultra sürümünün maliyeti, 48 fps’de 4K çözünürlükte video oluşturma ve tam kalitede ses için saniye başına 0,12 ABD dolarıdır. Fiyatlar çözünürlüğe nazaran de değişim gösteriyor ve kullanıcılar 720p, 1080p, 2K ve 4K içinde seçim yapabiliyor.

Lightricks, modelin işleme verimliliği yardımıyla fiyatlandırmasının LTX-2’yi rakip modellere nazaran %50’ye kadar daha ucuz hale getirdiğini, genişletilmiş projeleri ekonomik açıdan daha uygun hale getirdiğini, sadece yinelemenin daha süratli ve önceki nesillere nazaran daha yüksek kalitede bulunduğunu iddia ediyor. Alternatif olarak kullanıcılar, modeli açık kaynak sürümünü indirerek ve gelecek ay GitHub’a ulaştıktan sonra tüketici sınıfı GPU’larda çalıştırarak modeli kullanabilecekler.

Fotoğraf deposu: Sıçratmayı kaldır

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Share post:

Popular

More like this
Related