نموذج ذكاء اصطناعي "واقعي بشكل مخيف" الموناليزا تغني!

 الموناليزا في دار المزادات كريستيز في باريس نوفمبر 2021

ساره الشمالي/إيلاف من لندن: بات بإمكان الموناليزا الغناء! فقد نجح فريق من العلماء في شركة "مايكروسوفت" في تطوير نموذج ذكاء اصطناعي ثوري يُدعى VASA-1، قادر على تحويل أي صورة ثابتة إلى فيديو متحرك مع مزامنة الشفاه وتعبيرات الوجه وحركات الرأس بشكلٍ واقعي مذهل.

تُحاكي المشاعر البشرية

يُمكن لـ VASA-1 تحويل أي صورة ثابتة، سواء أكانت صورة شخصية أو لوحة فنية، إلى فيديو متحرك "ذو تعابير حية" تُحاكي المشاعر البشرية.
وقال الفريق في ورقة بحثية: "لقد قدمنا VASA، وهو إطار عمل لتوليد وجوه ناطقة نابضة بالحياة مع مهارات عاطفية بصرية جذابة (VAS) من خلال صورة ثابتة واحدة ومقطع صوتي للكلام”.
فمثلاً، باستخدام صورة الموناليزا، استطاع العلماء جعلها "تغني" أغنية Paparazzi بصوت آن هاثاواي، مع مزامنة الشفاه وتعبيرات الوجه وحركات الرأس بشكلٍ متقن.

https://twitter.com/Adamaestr0_/status/1781395640565530633?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1781395640565530633%7Ctwgr%5E1bf0e03f27b8e19e082399b48d91062303c8c98c%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Felaph.com%2FWeb%2FNews%2F2024%2F04%2F1535550.html

إمكانيات واسعة للتفاعلات الرقمية

يُتيح هذا النموذج إمكانيات هائلة للتفاعلات الرقمية في المستقبل، حيث يُمكن استخدامه في إنشاء شخصيات افتراضية نابضة بالحياة للتفاعل مع البشر في مختلف المجالات، مثل التعليم والترفيه وخدمة العملاء. كما يمكن تعزيز التفاعل على وسائل التواصل الاجتماعي من خلال تحويل الصور الثابتة إلى رسوم متحركة تفاعلية.
ويشار إلى أن VASA هو اختصار لـ Visual Affective Skills Animator (بمعنى الرسوم المتحركة للمهارات البصرية العاطفية)، وهو نموذج قادر على تحويل أي صور ثابتة سواء تم التقاطها بواسطة الكاميرا، أو رسمها، إلى رسوم متحركة "متزامنة بشكل رائع".
ويمكن لـ VASA إنشاء فيديو حقيقي "مخيف"، حيث تحاكي "الوجوه الناطقة الواقعية" سلوكيات المحادثة البشرية من خلال إيماءات الوجه وحركة العين والرأس الطبيعية، وكل ذلك من صورة ثابتة واحدة للرأس.
مخاوف انتحال الشخصية
يُثير هذا النموذج مخاوف انتحال الشخصية، خاصةً مع قدرته على جعل أي شخص "يقول" أي شيء.
يُؤكد فريق البحث في "مايكروسوفت" أن هدفهم من الأداة ليس تعزيز التزييف العميق، بل استكشاف إمكانيات التفاعل مع الشخصيات الافتراضية وتوفير الرفقة.
ويُشدد الفريق على ضرورة استخدام هذه التقنية بشكل مسؤول ووفقا للوائح المناسبة، مُؤكدين على اهتمامهم بتطبيقها لتعزيز اكتشاف التزوير.

مستقبل رقمي تفاعلي
تُمثل تقنية VASA-1 خطوة جديدة في مجال الذكاء الاصطناعي، وتُقدم إمكانيات كبيرة للتفاعلات الرقمية في المستقبل.
مع الأخذ بعين الاعتبار مخاوف انتحال الشخصية ومسؤولية الاستخدام، سيكون من المثير للاهتمام مشاهدة كيفية استخدام هذه التقنية في السنوات القادمة.

 

  

إذاعة وتلفزيون‏



الأبراج وتفسير الأحلام

المتواجدون حاليا

1087 زائر، ولايوجد أعضاء داخل الموقع