यह एक एआई मॉडल है जो लुमियर नामक अत्याधुनिक स्तर पर वीडियो बनाता है।

मूल रूप से, Google के पास एक वीडियो निर्माता था जिसे वीडियोकवि पहले से
वीडियोकवि - गूगल रिसर्च
शून्य-शॉट वीडियो निर्माण के लिए एक बड़ा भाषा मॉडल। VideoPoet सरल मॉडलिंग विधि का प्रदर्शन करता है जो किसी भी ऑटोरेग्रेसिव भाषा मॉडल को उच्च गुणवत्ता वाले वीडियो जनरेटर में परिवर्तित कर सकता है।

नाम आकार जनरेटर के साथ। इमेजजेन
छवि वीडियो
प्रसार मॉडल के साथ उच्च परिभाषा वीडियो पीढ़ी

लेकिन लुमियर बाहर आ गया। यह मूल की तुलना में बहुत ठंडा है, और यह उच्च गुणवत्ता वाले शॉर्ट-फॉर्म वीडियो बना सकता है।
बेसिक्स
- Lumiere को 30 मिलियन से अधिक वीडियो के डेटासेट के साथ प्रशिक्षित किया गया है। इसका अभ्यास करने के लिए डाले गए पाठ कैप्शन के साथ 80 फ़्रेम लंबे।
- यह प्रति सेकंड 16 फ्रेम वीडियो का उत्पादन कर सकता है।
- ऐसा नहीं है कि 30 मिलियन वीडियो एक ही स्रोत से लिए गए हैं।
यह काम Google रिसर्च टीम और इज़राइल के प्रमुख प्रौद्योगिकी विश्वविद्यालयों के बीच एक संयुक्त शोध है, अर्थात्:
Lumiere में 4 शानदार विशेषताएं हैं:
- वीडियो एडिटिंग - आप कमांड (आसान लेकिन बहुत दिव्य) को संकेत देकर इसे हल कर सकते हैं।
- शैलीबद्ध पीढ़ी - आप हमारे द्वारा प्रदान किए गए संदर्भ से एक वीडियो बना सकते हैं (आप संदर्भ को छवि या वीडियो के रूप में दे सकते हैं)। मॉडल शैली सीखेगा और फिर उस शैली का उपयोग करने के लिए एक वीडियो बनाएगा।


- छवि & वीडियो के लिए पाठ - केवल एक संदेश के रूप में एक संकेत न डालें। उदाहरण के लिए, एक स्थिर चेहरे के साथ हमारी एक तस्वीर फेंक दें और फिर इसे हंसते हुए हमारी तस्वीर बनाने के लिए कहें। यह किया जा सकता है, यह बहुत ईश्वरीय है।
- सिनेमाग्राफ - छवि के केवल एक हिस्से का चयन करें और इसे एक वीडियो में चेतन करें।
मूल
यह सारी जानकारी GitHub पर प्रकाशित Google शोध है।
Lumiere - Google ResearchGoogle Research.lumiere-video.github.io द्वारा Google ResearchSpace-Time टेक्स्ट-टू-वीडियो प्रसार मॉडल

Paper งานวิจัย

शोधकर्ताओं में से एक, जिसका नाम हिला शेफ तेल अवीव विश्वविद्यालय से, इसे एक्स पर पोस्ट किया गया था।