
ChatGPT मेकर OpenAI लगातार AI Agents पर काम कर रहा है. दुनिया AI Agent को नेक्स्ट बिग थिंग के तौर पर भी देख रही है. AI Agents क्या होते हैं हमने आपको कई बार बताया भी है. अब OpenAI ने Operator नाम का अपना पहला AI Agent पब्लिक के लिए जारी कर दिया है, हालांकि अभी ये लिमिटेड है.
OpenAI ने Operator का रिसर्च प्रिव्यू जारी किया है. कंपनी के ब्लॉगपोस्ट के मुताबिक़ Operator आपके लिए ख़ुद टास्क्स परफॉर्म करेगा और इसे कम से कम ह्यूमन इंटरवेंशन की ज़रूरत पड़ेगी. मौजूदा AI Chatbots में या AI टूल में ह्यूमन इंटरवेंशन की हर वक्त ज़रूरत होती है.
कंपनी के मुताबकि Operator वेब ब्राउजर यूज़ करके ख़ुद ही वेब पेज के साथ इंट्रैक्ट कर सकता है. ख़ुद से क्वेरी टाइप कर सकता है, क्लिक कर सकता है और स्क्रॉल भी कर सकता है. यानी आपको कुछ करने की ज़रूरत नहीं होगी.
OpenAI का ये टूल फ़िलहाल अमेरिका के लिए लॉन्च किया गया है. हालांकि ये AI Agent सिर्फ ChatGPT Pro यूजर्स को ही मिलेगा.
Operator के काम करने का तरीका
जैसे आप किसी वेबसाइट ओपन करते हैं. इसके लिए आपको क्लिक करने होता है और टाइप करना होता है. ज़ाहिर है इसके लिए आप माउस और कीबोर्ड या स्क्रीन टच यूज़ करेंगे. लेकिन Operator के आ जाने से ये सबकुछ ख़ुद हो जाएगा.
यह भी पढ़ें: ChatGPT और Gemini से आगे निकला चीनी DeepSeek AI, फ्री मिल रही सर्विस
Operator ये सभी काम ख़ुद कर सकता है. यानी क्लिक से लेकर टाइप तक Operator ही करेगा. सेल्फ करेक्शन के लिए रीजनिंग यूज़ करेगा. अगर कहीं फंसेगा तो फिर आपकी मदद लेगा. यानी यूजर कंट्रोल कर पाएंगे.
Open AI के Operator में इनबिल्ट वर्चुअल ब्राउजर है. जैसे ही आप यहां कोई कमांड लिखेंगे खुद से ही वेबसाइट ओपन हो जाएगी. जैसे आप वेबसाइट के साथ कीबोर्ड और माउस से इंट्रैक्ट करते हैं ठीक वैसे ही Operator करेगा, लेकिन इसके लिए वो कीबोर्ड और माउस यूज नहीं करेगा.
खुद से वेबसाइट पर करेगा इंट्रैक्ट
OpenAI ने YouTube पर एक डेमोंस्ट्रेशन वीडियो भी जारी किया है जिसमें Operator के काम करने का तरीका देखा जा सकता है. डेमोंस्ट्रेशन में दिखाया गया है कि कैसे Operator खुद से ही शॉपिंग वेबसाइट पर जा कर आपके बताए गए सामान को कार्ट में ऐड कर रहा है और पेमेंट चेकआउट तक जा रहा है.
इसी तरह इस डेमोंस्ट्रेशन में ये भी देख सकते हैं कि कैसे Operator बिना यूजर इंटरवेंशन के यूजर के लिए होटल की टेबल बुक कर रहा है. ये तमाम चीजें इनबिल्ट ब्राउजर में हो रही होती हैं और आप इसे रियल टाइम देख भी सकते हैं. जरूरत पड़ने पर आप Takeover यूज करके अपने कंट्रोल में ले सकते हैं और फिर Operator को कंट्रोल दे सकते हैं. कंपनी ने कहा है कि आप लगातार इससे मल्टिपल टास्क परफॉर्म करा सकते हैं.
अगर वेबसाइट आपकी सेंसिटिव डिटेल्स मांगेगी तो Operator आपको टेकओवर लेने के लिए कहेगा. लॉगइन क्रेडिंशियल या कार्ड डिटेल्स फ़िल करने के लिए भी ह्यूमन इंटरवेंशन की ज़रूरत होगी.
Open AI इस AI Agent को बेहतर करने के लिए कई कंपनियों के साथ पार्टनरशिप कर रही है. Uber के साथ भी पार्टनरशिप किया गया है ताकि कंपनी रियल वर्ल्ड नीड्स को समझा जा सके. कैब बुक करने से लेकर कैब ड्राइवर से बातचीत करने के लिए आप Operator को लगा सकते हैं.
हालांकि अभी ये सॉलिड मॉडल नहीं है — यानी ये कॉम्प्लेक्स इंटरफेस के साथ ठीक से काम नहीं कर सकता है जैसे ये स्लाइड शो बनाने और कैलेंडर बनाने में इश्यू है. कंपनी ने ये साफ़ कर दिया है कि इसमें कई प्रॉब्लम्स हैं और ये सटीक नहीं है. आने वाले समय में कंपनी Operator को GPT Plus, Team और एंटरप्राइज यूजर्स के लिए भी जारी कर देगी.