ChatGPT की भारी सफलता के बाद OpenAI ने एक नया AI मॉडल GPT-4o लॉन्च कर दिया है. यहां o का मतलब Omni है. कंपनी ने कहा है कि ये इंसान और कंप्यूटर के बीच के इंट्रैक्शन के लिए एक बड़ा कदम है. ये नया मॉडल रियल टाइम टेक्स्ट, ऑडियो और वीडियो पर काम करता है. शॉर्ट में समझें तो GPT मेकर्स अब ऐसा टूल लेकर आ चुके हैं जो वाकई इंसानों की तरह ही बात कर रहा है.
ग़ौरतलब है कि मौजूदा ChatGPT (फ्री वर्जन) सिर्फ़ टेक्स्ट पर काम करता है. लेकिन अब टेक्स्ट के अलावा GPT ऑडियो, इमेज और विजुअल को भी समझ पाएगा. आपके आस पास क्या हो रहा है ये भी ChatGPT देख कर बता देगा.
कंपनी के मुताबिक़ GPT 4o GPT 4 का ही एक आइटरेशन है जो बेहद फ़ास्ट और ये टेक्स्ट, विजन और ऑडियो पर काम करता है. OpenAI CTO मीरा मुराती ने GPT 4o का ऐलान करते हुए कहा कि ये सभी GPT यूज़र्स के लिए फ़्री है और पेड यूज़र्स के लिए ज़्यादा लिमिट दिया जाएगा. ये मॉडल इंसानों की तरह आपसे बातचीत भी कर सकता है.
OpenAI CEO Sam Altman ने कहा कि ये मॉडल दरअसल मल्टीमॉडल है जो वॉयस, टेक्स्ट और इमेज के ज़रिए भी कमांड ले सकता है. तीनों तरह से कमांड लेकर GPT 4o ख़ुद से कॉन्टेंट जेनेरेट कर सकता है. यानी अब सिर्फ़ टेक्स्ट ही नहीं, बल्कि विज़ुअल, इमेज या ऑडियो को भी ChatGPT समझ पाएगा.
क्या है GPT-4o (What is GPT-4o)
OpenAI ने GPT-4o का डेमो भी दिया है जो बेहद दिलचस्प है. कैमरा ChatGPT इंटरफेस में जा कर आप अगर अपने कैमरा का ऐक्सेस देंगे तो आस पास की चीजों को देख कर GPT 4o बता देगा कि क्या हो रहा है. यानी GPT 4o आपके चारों की तरफ की चीजों को देख कर समझ सकता है कि क्या हो रहा है. उदाहरण के तौर पर कौन क्या कर रहा है, किसने क्या पहन रखा है या फिर क्या चीजें रखी हैं -- ये सबकुछ GPT 4o देख कर समझ सकता है और आप इससे जुड़ा कोई भी सवाल पूछ सकते हैं.
OpenAI के मुताबिक GPT-4o किसी भी ऑडियो इनपुट का रिप्लाई 232 मिलिसेकंड्स में दे सकता है जो इंसानों के रिस्पॉन्स के बराबार ही है. यानी इंसान भी किसी बात को सुन कर इतने ही समय में जवाब देता है.
वीडियो डेेमोंस्ट्रेशन में आप देख सकते हैं कि कैसे GPT-4o आस पास हो रही चीजों के बारे में बता रहा है. यहां तक ये भी बता रहा है कि लाइटिंग आर्टिफिशियल है या नैचुरल. आस पास की चीजों को देख कर ये गाना भी कंपोज कर रहा है. सिर्फ आपको बोलना है कि आस पास की चीजों को देख कर गाना तैयार कर दो तो GPT 4o तुरंत गाना कंपोज कर दे रहा है.
इंसानों की तरह बातचीत करता है GPT-4o
अभी तक ChatGPT से नॉर्मली लोग टेक्स्ट के जरिए कम्यूनिकेट करते हैं. लेकिन कंपनी ने ऐसा डेमो दिखाया है जिसे देख कर सभी हैरान हैं. दरअसल इंसानों की तरह GPT 4o भी बातचीत कर रहा है.
OpenAI ने कई डेमो वीडियोज जारी किए हैं जो बेहद दिलतस्प हैं. क्योंकि GPT 4o के बातचीत करने का तरीका और टोन पूरी तरह से इंसानों जैसा ही है. अगर आपको पता नहीं है कि ये AI तो पहचान कर पाना मुमकिन नहीं होगा. कंपनी ने इस GPT 4o मॉडल को ऐसे ट्रेन किया है कि ये मजाक भी समझता है.
GPT 4o में यूज़र्स स्क्रीनशॉट या डॉक्यूमेंट्स अपलोड करके उसके बारे में पूछ सकते हैं. यहां सर्च भी रियलटाइम होगा और बातचीत भी रियलटाइम किया जा सकेगा. कंपनी ने दावा किया है कि ये इंसानों जितने तेज़ी से रेस्पॉन्स करता है.
क्या आपने देखी है Her फिल्म?
अगर आपने Her फिल्म देखी है तो आप समझ सकते हैं. क्योंकि Her फिल्म में एक शख्स को AI से प्यार हो जाता है. OpenAI के सीईओ ने X पर Her लिख कर पोस्ट किया है. जाहिर है Sam Altman का इशारा Her फिल्म की तरफ ही है. क्योंकि GPT - 4o भी बिल्कुल वैसे ही बातचीत कर रहा है जैसा Her फिल्म में दिखाया गया है.
Developing story...