تكنولوجيا Baidu تقدم نموذج MuseStreamer لتوليد فيديو ذكاء اصطناعي ينافس Veo 3 من Google
أطلقت شركة Baidu مؤخرًا نموذجًا مبتكرًا للذكاء الاصطناعي يُعرف باسم MuseStreamer، وهو مخصص لتوليد مقاطع الفيديو بشكل يضاهي التقنية المتوفرة في نموذج Veo 3 من Google, هذا النموذج فريد من نوعه حيث يمكنه دمج الصوت الصيني في الفيديوهات المولدة، ما يجعله الأول في العالم الذي يدعم توليد الصوت بلغة صينية أصلية، بعيدًا عن النماذج الأخرى.
تحدي الشركات الكبرى
شهدت صناعة نماذج توليد الفيديو بالذكاء الاصطناعي قفزات نوعية على مدار العامين الماضيين, في السابق، كانت النماذج تعاني من صعوبات في توليد صور بشرية دقيقة، أما الآن، فقد تمكنا من تصوير الحركة والفيزياء بدقة عالية, رغم ذلك، كانت شركات عديدة متحفظة في إنتاج مقاطع الفيديو التي تدعم الصوت الأصلي, إلا أن Google كانت السباقة في هذا المجال عندما أطلقت Veo 3 خلال مؤتمرها للمطورين في 2025، محققة سبقًا ملحوظًا في السوق.
مزايا MuseStreamer
جاءت Baidu لتكون رائدة جديدة في هذا المجال بإطلاقها MuseStreamer، الذي لا يقتصر فقط على إنتاج مقاطع فيديو بل يمكنه أيضًا إضافة مؤثرات صوتية وضوضاء محيطة, قدّرت الشركة أن النموذج حقق نسبة 89,38% في معيار VBench I2V وأعلنت عن تقديم أدوات جديدة لإنشاء المحتوى من خلال برنامج LLM الخاص بها.
منصة HuiXiang الجديدة
علاوة على MuseStreamer، أطلقت Baidu أيضًا منصة جديدة تُعرف بـ HuiXiang، التي تعني "تخيّل"، وتتيح للمستخدمين مشاركة الأفكار وإنشاء مقاطع فيديو بسهولة, هذه المنصة تدعم حاليًا إنشاء مقاطع تمتد إلى 10 ثوانٍ بدقة عالية، وهي ميزة تتفوق بها على Veo 3 الذي يقتصر على مقاطع قصيرة.
مع استمرار المنافسة المحتدمة في سوق الفيديو بالذكاء الاصطناعي، تظهر Baidu كواحدة من الشركات الرائدة التي تتطلع للتطوير والابتكار, ومع أن MuseStreamer و HuiXiang غير متاحين خارج الصين حتى الآن، إلا أن هناك توقعات كبيرة حول تأثيرهم في المستقبل القريب.