كشفت شركة ميتا عن إطلاق مشروع جديد يحمل اسم NotebookLlama، والذي يهدف إلى تقديم نسخة مفتوحة المصدر من نظام الحلقات الصوتية التفاعلية "البودكاست" معتمدًا على الذكاء الاصطناعي. يأتي هذا المشروع لمنافسة منصة جوجل الشهيرة NotebookLM التي حققت انتشارًا واسعًا مؤخرًا.
تعتمد أداة NotebookLlama على نماذج الذكاء الاصطناعي الخاصة بشركة ميتا والمعروفة باسم Llama، حيث تتولى هذه النماذج جزءًا كبيرًا من عمليات المعالجة الصوتية. وكما هو الحال مع NotebookLM، تعمل NotebookLlama على تحويل النصوص المكتوبة إلى ملخصات صوتية بأسلوب يشبه حلقات البودكاست، ما يتيح تقديم محتوى تفاعلي وجذاب.
في المراحل الأولى، تقوم الأداة بتحويل النصوص إلى ملفات صوتية، مثل مقالات الأخبار أو المنشورات، مع إضافة لمسات درامية وتفاعلات تضفي حيوية على المحتوى. بعد ذلك، يتم إرسال هذه الملفات إلى نماذج مفتوحة لتحويل النص إلى صوت.
ورغم القدرات المتقدمة التي تتمتع بها NotebookLlama، إلا أن جودة الصوت التي تقدمها ما زالت دون مستوى المنافسة مع أداة NotebookLM التابعة لجوجل. فعند مقارنة عينات الصوت، يظهر أن الأصوات التي تولدها ميتا تبدو آلية وغير طبيعية إلى حد كبير، بالإضافة إلى بعض التداخلات غير المتناسقة في الحديث.
مع ذلك، أشار فريق الباحثين في ميتا إلى إمكانية تحسين الجودة من خلال استخدام نماذج أقوى، وأوضحوا أن "نموذج تحويل النص إلى صوت هو العامل الأساسي في تحسين الصوت الطبيعي". وأضافوا أن هناك توجهًا لتجربة أساليب أخرى في إنشاء البودكاست، مثل استخدام اثنين من وكلاء الذكاء الاصطناعي لتنظيم الحوار والمناقشة، بدلاً من الاعتماد على نموذج واحد لكتابة المحتوى.
يجدر بالذكر أن مشروع NotebookLlama ليس المحاولة الأولى لتقليد منصة جوجل، حيث شهدت الساحة عدة مشاريع تهدف إلى استنساخ تجربة البودكاست التي تقدمها NotebookLM. ومع ذلك، لا يزال التحدي الأكبر يكمن في التغلب على مشكلة "الهلوسة" التي تصيب تطبيقات الذكاء الاصطناعي، بما في ذلك أداة جوجل نفسها، حيث قد تُنتج معلومات غير دقيقة أو مختلقة خلال عملية توليد البودكاست.
0 تعليق