شركة Open ai (Sora) تقوم بتعليم الذكاء الاصطناعي لفهم ومحاكاة العالم المادي المتحرك، بهدف تدريب النماذج لمساعدة الأشخاص على حل المشكلات التي تتطلب تفاعلًا في العالم الحقيقي.
نقدم لكم Sora، لتحويل النص إلى فيديو. يمكن لـ Sora إنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة مع الحفاظ على الجودة المرئية وتلبية احتياجات المستخدم.
يستطيع Sora إنشاء مشاهد معقدة بشخصيات متعددة، وأنواع محددة من الحركة، وتفاصيل دقيقة للموضوع والخلفية. لا يفهم النموذج ما يطلبه المستخدم عندما يُطلب منه ذلك فحسب، بل يفهم أيضًا كيفية وجود هذه الأشياء في العالم المادي.
هناك نقاط ضعف في النموذج الحالي. قد يكون من الصعب وضع نموذج دقيق لفيزياء السيناريوهات المعقدة، وقد لا يتم فهم حالات محددة من العلاقات بين السبب والنتيجة. على سبيل المثال، قد يأخذ شخص ما قضمة من ملف تعريف الارتباط، ولكن قد لا تكون هناك علامة قضمة على ملف تعريف الارتباط بعد ذلك.
يمكن أن يخلط النموذج أيضًا بين التفاصيل المكانية للمتجهات، مثل اليسار واليمين، ويمكن أن يواجه صعوبة في تقديم وصف دقيق للأحداث بمرور الوقت، مثل اتباع مسار كاميرا محدد.