Google DeepMind का Genie 3… सिर्फ टेक्स्ट कमांड से बनाएं रियल-टाइम 3D वर्चुअल दुनिया

Google DeepMind ने हाल ही में अपना नया और AI मॉडल Genie 3 पेश किया है, जो सिर्फ एक साधारण टेक्स्ट कमांड के जरिए 3D इंटरैक्टिव वर्चुअल दुनिया बनाने में सक्षम है. उदाहरण के लिए, यदि कोई यूजर लिखता है, “बारिश में भीगता हुआ जंगल' तो Genie 3 उस सीन को 720p रेजोल्यूशन पर 24 फ्रेम प्रति सेकंड की दर से वास्तविक समय में प्रस्तुत कर सकता है.बेहतर इंटरैक्शन और विजुअल मेमोरीGenie 3 अपने पुराने वर्ज़न Genie 2 की तुलना में काफी उन्नत है. जहां Genie 2 केवल 10 से 20 सेकंड तक ही इंटरैक्शन दे पाता था, वहीं Genie 3 लगातार कई मिनटों तक वातावरण के साथ संवाद और बदलाव करने की सुविधा देता है. सबसे खास बात यह है कि इसमें विजुअल मेमोरी की क्षमता है. यानी अगर कोई यूजर किसी वर्चुअल लोकेशन से हटकर बाद में वापस लौटे, तो वहां की वस्तुएं और माहौल पहले जैसा ही मिलता है. यह मेमोरी लगभग एक मिनट तक दृश्य को याद रख सकती है.डायनामिक बदलाव और इवेंट ट्रिगरGenie 3 केवल स्थिर दृश्यों तक सीमित नहीं है, बल्कि यह एक 'world model' के रूप में कार्य करता है. इसका मतलब है कि यूजर मौसम बदल सकते हैं, नए कैरेक्टर जोड़ सकते हैं, या किसी वस्तु का रूप बदल सकते हैं वो भी सिर्फ टेक्स्ट कमांड से. यह मॉडल किसी भी वर्चुअल वातावरण को जीवंत और इंटरैक्टिव बनाने की क्षमता रखता है.AGI की दिशा में एक महत्वपूर्ण कदमGoogle DeepMind के अनुसार, ऐसे वर्ल्ड मॉडल्स भविष्य में AGI (Artificial General Intelligence) की दिशा में एक अहम आधार साबित हो सकते हैं. इनका इस्तेमाल रोबोटिक्स, गेमिंग, ट्रेनिंग और शिक्षा के क्षेत्रों में AI एजेंट्स को विभिन्न परिस्थितियों में प्रशिक्षित करने के लिए किया जा सकता है. उदाहरण के लिए, रोबोट को जटिल कार्य सिखाने से पहले वर्चुअल दुनिया में उसका सिमुलेशन किया जा सकता है.सीमाएं और वर्तमान उपलब्धताहालांकि Genie 3 कई मायनों में उन्नत है, फिर भी इसकी कुछ सीमाएं हैं. फिलहाल यह सटीक भौगोलिक स्थान नहीं बना सकता और किसी दृश्य में टेक्स्ट तभी स्पष्ट दिखता है जब वह शुरुआती इनपुट का हिस्सा हो. मल्टी-एजेंट इंटरैक्शन की सुविधा अभी विकास के चरण में है. यही कारण है कि Google ने इसे अभी आम जनता के लिए लॉन्च नहीं किया है. वर्तमान में यह केवल सीमित संख्या में क्रिएटर्स के साथ टेस्टिंग के लिए उपलब्ध है, ताकि सुरक्षा और जिम्मेदारी से जुड़े पहलुओं को ठीक से संभाला जा सके.Genie 3 न केवल वर्चुअल दुनिया बनाने का तरीका बदल सकता है, बल्कि यह आने वाले समय में AI और मानव इंटरैक्शन की सीमाओं को भी आगे बढ़ा सकता है.

Google DeepMind का Genie 3… सिर्फ टेक्स्ट कमांड से बनाएं रियल-टाइम 3D वर्चुअल दुनिया

बेहतर इंटरैक्शन और विजुअल मेमोरी

ये भी पढें

डायनामिक बदलाव और इवेंट ट्रिगर

AGI की दिशा में एक महत्वपूर्ण कदम

सीमाएं और वर्तमान उपलब्धता

संबंधित ख़बरें

Most Viewed

Viral