AI यानी आर्टिफिशियल इंटेलिजेंस की दुनिया में हर दिन कुछ-ना-कुछ नया हो रहा है. आम लोगों और कंटेंट क्रिएटर्स के लिए भी डेवलपर्स कुछ खास टूल्स लॉन्च करते रहते हैं. कुछ वक्त पहले ही OpenAI ने Sora और Google ने Vids को पेश किया है, जो टेक्स्ट-टू-वीडियो जनरेट कर सकते हैं.
अब Microsoft ने VASA-1 AI वीडियो जनरेटर लॉन्च किया है. कंपनी ने अपनी आधिकारिक वेसबाइट पर इस टूल के कई सैंपल पेश किए हैं. ये टूल किसी भी फोटो से उस शख्स का वीडियो तैयार कर सकता है. कंपनी ने जो सैंपल पेश किए हैं, उनके रिजल्ट बेहतरीन हैं.
माइक्रोसॉफ्ट के इस टूल का नाम विजुअल अफेक्टिव स्किल ऑडियो या VASA-1 है. ये कंपनी का टॉप एंड मॉडल है, जो इंसानों के फेशियल एक्सप्रेशन को बेहतरीन तरीके से क्रिएट कर सकता है. ये टूल तमाम तरीकों की फीलिंग और इमोशन को लोगों के चेहरे पर फोटोज से जनरेट कर सकता है.
आसान भाषा में कहें, तो किसी की सिंपल तस्वीर से उस शख्स का अलग-अलग एक्सप्रेशन वाला वीडियो तैयार किया जा सकता है. ये टूल फेस मसल्स, लिप्स, नोज, हेड टिल्ट और दूसरे फैक्टर की मदद से वीडियो तैयार करता है. इसके कुछ वीडियो भी सामने आए हैं.
यह भी पढ़ें: ChatGPT को टक्कर देने के लिए साथ आ रहे Apple और Google, iPhone में मिलेगा Gemini!
फिलहाल Microsoft VASA-1 अधिकतम 512×512 pixels का वीडियो 40fps पर क्रिएट कर सकता है. कंपनी का दावा है कि ये टूल रीयल लाइफ जैसा वीडियो क्रिएट कर सकता है. यानी इसकी मदद से आप असल जिंदगी में जैसे एक्सप्रेशन देते हैं. वैसा ही वीडियो में दे सकेंगे.
माइक्रोसॉफ्ट ने VASA-1 को एक रिसर्च डेमोस्ट्रेशन के तौर पर दिखाया है. कंपनी ने साफ किया है कि इस प्रोडक्ट को रिलीज करने या इसका API जारी करने का उनका कोई प्लान नहीं है. इसका मतलब है कि माइक्रोसॉफ्ट इस प्रोडक्ट को पब्लिक के लिए रिलीज नहीं करेगा. क्योंकि इसके गलत इस्तेमाल होने की संभावना ज्यादा है.
यह भी पढ़ें: ChatGPT मेकर OpenAI ने किया कमाल, पेश किया Sora, बदल जाएगा वीडियो बनाने का तरीका
ये टूल OpenAI के Sora जैसा ही है. दोनों ही टूल्स रियलिस्टिक वीडियो जनरेट करते हैं. जहां Sora कॉम्प्लेक्स वीडियो को बैकग्राउंड और आर्टिफैक्ट्स के साथ बनाता है. वहीं VASA-1 का फोनस ह्यूमन एक्सप्रेशन पर है. हालांकि, ये दोनों ही टूल अभी पब्लिक डोमेन में उपलब्ध नहीं हैं.