(SeaPRwire) – سنغافورة، 11 أغسطس 2025 — في 12 أغسطس، أعلنت Skywork AI عن إطلاق Matrix-Game 2.0، النسخة المطورة من نموذج عالمها التفاعلي ضمن سلسلة Matrix. يقدم هذا النموذج الرائد توليد فيديو تفاعلي في الوقت الفعلي وبسلاسل طويلة عبر سيناريوهات الأغراض العامة، والنموذج مفتوح المصدر بالكامل، مما يجعله الأول من نوعه في الصناعة.
يمثل Matrix-Game 2.0 قفزة نوعية في كل من الأداء في الوقت الفعلي وقدرات توليد السلاسل الطويلة. مع التركيز على زمن الانتقال المنخفض ومعدلات الإطارات العالية، يمكن للنموذج أن يولد فيديو متواصلًا بثبات بمعدل 25 إطارًا في الثانية (FPS) عبر بيئات معقدة، بمدد تصل إلى دقائق. والنتيجة هي تعزيز كبير في الاتساق وسهولة الاستخدام والانغماس.
بالإضافة إلى الاستدلال الأسرع، يحافظ Matrix-Game 2.0 على فهم دقيق للفيزياء ودلالات المشهد. يمكن للمستخدمين إصدار أوامر بسيطة لاستكشاف وتعديل وبناء بيئات افتراضية متسقة هيكليًا وغنية بصريًا وسليمة منطقيًا في الوقت الفعلي. يزيل هذا الاختراق الحاجز بين توليد المحتوى والمشاركة التفاعلية، ويفتح إمكانيات جديدة للتطبيقات في البشر الافتراضيين ومحركات الألعاب والذكاء الاصطناعي المجسد (embodied AI) والمزيد.
هندسة النموذج
يقدم Matrix-Game 2.0 نهجًا جديدًا لنمذجة العالم التفاعلي يعتمد على الرؤية – مبتعدًا عن الاعتماد على أوامر اللغة ومركزًا على الفهم المكاني والتعلم القائم على الفيزياء.
- 3D Causal VAE Compression: يضغط الأبعاد المكانية والزمانية بكفاءة لتحسين النمذجة والتوليد.
- Multimodal Diffusion Transformer (DiT): يجمع بين ترميز الرؤية وأوامر حركة المستخدم لتوليد سلاسل ديناميكية واقعية إطارًا بإطار.
- User Interaction Module: يكيف أطر عمل GameFactory و Genie لتمكين التحكم في الوقت الفعلي.
توليد الفيديو التراجعي في الوقت الفعلي
باستخدام استراتيجية التدريب الذاتي الإجبار (Self-Forcing)، يستخدم Matrix-Game 2.0 آلية توليد انتشار تراجعية مبتكرة للتغلب على زمن الانتقال وتراكم الأخطاء في النماذج التقليدية:
- Causal Diffusion Model Distillation: يقلل تأخير السلسلة عن طريق التكييف على الإطارات السابقة.
- Distribution Matching Distillation (DMD): يواءم توزيعات التدريب والاستدلال للحصول على نتائج أكثر استقرارًا.
- KV Cache Mechanism: يمكن من توليد فيديو طويل وسلس بدون حسابات زائدة، ويدعم طول إخراج غير محدود بمعدل 25 إطارًا في الثانية (FPS) على وحدة معالجة رسومات واحدة.
التطبيقات والأداء
يدعم Matrix-Game 2.0 تفاعلات ديناميكية ومتسقة مع الفيزياء – مثل حركة الشخصيات ودوران الكاميرا – عبر إدخال لوحة المفاتيح والماوس. وهو قابل للتطبيق على مشاهد متنوعة، بما في ذلك بيئات على غرار GTA، و Minecraft، واستكشاف العالم المفتوح، مع تعزيز القدرة على التكيف عبر المجالات والواقعية الفيزيائية.
ثلاثة اختراقات أساسية:
- توليد سلاسل طويلة عالية الإطارات في الوقت الفعلي: تفاعلات طبيعية ومستجيبة تستمر لدقائق بمعدل 25 إطارًا في الثانية.
- التعميم متعدد المشاهد: قابل للتكيف مع أنماط وبيئات مختلفة، من المناظر الحضرية إلى التجسيدات الفنية.
- تعزيز الاتساق الفيزيائي: حركة واقعية على التضاريس المعقدة، مما يعزز الانغماس والتحكم.
يضع Matrix-Game 2.0 معلمًا جديدًا لأبحاث وتطبيقات الذكاء المكاني، ممهدًا الطريق لتدريب الذكاء الاصطناعي المجسد، والبناء السريع للعوالم الافتراضية، وإنشاء المحتوى للأفلام والميتافيرس.
روابط المصدر المفتوح:
- التقرير الفني:
- صفحة المشروع:
- HuggingFace:
- GitHub:
Skywork AI هي مساحة عمل ومنصة إبداعية للذكاء الاصطناعي موجهة للمستهلكين، تساعد المستخدمين العاديين على إنتاج عروض تقديمية وجداول بيانات ومقاطع فيديو ومستندات ومحتوى تفاعلي في دقائق – مبنية حول سير عمل محادثات بديهية. تقدم المنصة مطالبات موجهة ومعاينات في الوقت الفعلي وتكاملات مع أدوات المكتب الشائعة لتسريع سير العمل للطلاب والعاملين المستقلين والفرق الصغيرة. متوفرة على الويب والجوال، تؤكد Skywork AI على سهولة الاستخدام، والقدرة على تحمل التكاليف، والتكرار السريع – جالبة أدوات الإبداع المتقدمة للذكاء الاصطناعي مباشرة إلى المستهلكين.
يتم توفير المقال من قبل مزود محتوى خارجي. لا تقدم SeaPRwire (https://www.seaprwire.com/) أي ضمانات أو تصريحات فيما يتعلق بذلك.
القطاعات: العنوان الرئيسي، الأخبار اليومية
يوفر SeaPRwire تداول بيانات صحفية في الوقت الفعلي للشركات والمؤسسات، مع الوصول إلى أكثر من 6500 متجر إعلامي و 86000 محرر وصحفي، و3.5 مليون سطح مكتب احترافي في 90 دولة. يدعم SeaPRwire توزيع البيانات الصحفية باللغات الإنجليزية والكورية واليابانية والعربية والصينية المبسطة والصينية التقليدية والفيتنامية والتايلندية والإندونيسية والملايو والألمانية والروسية والفرنسية والإسبانية والبرتغالية ولغات أخرى.
للتواصل: Peter Tian Skywork AI PTE.LTD. peter (at) skywork.ai