Close Menu
  • بيت
  • آسيا
  • كرة القدم
  • أخبار عامة
  • أحدث الأخبار
  • أخبار LFG
  • سوق
    • الشرق الأوسط
  • سياسي
  • عالم
  • الرياضة
  • أخبار المشاهير العرب

اشترك في نشرتنا الإلكترونية مجاناً

اشترك في نشرتنا الإخبارية لتبق على اطلاع بأحدث أخبارنا.

اشترك في نشرتنا الإخبارية للاطلاع على أحدث المنشورات والنصائح، لنبقى على اطلاع!

اختيارات المحرر

حلا الترك تغني باللهجة اللبنانية وتختار فيروز (فيديو)

أغسطس 7, 2025

تقرير يكشف “نظاما سريا” تستخدمه “حماس” لدفع رواتب الموظفين في غزة

أغسطس 7, 2025

غزة بين رغبات نتنياهو… والاستنزاف الطويل

أغسطس 7, 2025
فيسبوك X (Twitter) الانستغرام
الخميس, أغسطس 7, 2025
  • Home
  • DMCA
  • أعلن معنا
  • اتصل بنا
  • الشروط والأحكام
  • سياسة الخصوصية
  • من نحن
Kinstrak News | كنستراك نيوزKinstrak News | كنستراك نيوز
  • بيت
  • آسيا
  • كرة القدم
  • أخبار عامة
  • أحدث الأخبار
  • أخبار LFG
  • سوق
    • الشرق الأوسط
  • سياسي
  • عالم
  • الرياضة
  • أخبار المشاهير العرب
Kinstrak News | كنستراك نيوزKinstrak News | كنستراك نيوز
أنت الآن تتصفح:Home » يستوعب المشاعر.. شاومي تكشف عن نموذج ذكي لإنشاء الأصوات
أحدث الأخبار

يستوعب المشاعر.. شاومي تكشف عن نموذج ذكي لإنشاء الأصوات

adminadminأغسطس 6, 2025لا توجد تعليقات3 دقائق
تويتر
شاركها
تويتر


أعلنت شركة شاومي عن نموذجها الصوتي الذكي الجديد مفتوح المصدر MiDashengLM‑7B، في خطوة نوعية تهدف إلى تعزيز البنية التقنية لمنصاتها في السيارات الكهربائية والأجهزة المنزلية الذكية، وذلك كامتداد مباشر لنموذجها الصوتي الأساسي Xiaomi Dasheng. 

وبحسب ما نشرته الشركة عبر شبكة ويبو الصينية، يأتي MiDashengLM‑7B كمحصلة لتطور كبير في تقنيات فهم الصوت، حيث يستند إلى معمارية صوتية متقدمة تعتمد على منصة Xiaomi Dasheng كمُشفر صوتي، إلى جانب نموذج Qwen2.5-Omni‑7B كوحدة فك ترميز يُعتمد عليها لتقديم تجربة متكاملة تتيح للنموذج فهم الكلام والأصوات البيئية والموسيقى بفاعلية موحدة. 

ويعتمد النموذج على استراتيجيات تدريب مبتكرة تعيد توصيف المشاهد الصوتية بطرق متطورة، مما يمكّنه من التقاط المعاني العميقة للمحتوى السمعي، بما يشمل مشاعر المتحدث والصدى المكاني وغيرها من الخصائص الصوتية الدقيقة التي تعجز نماذج تحويل الصوت التقليدية عن اكتشافها.

وقد أظهر النموذج تفوقاً ملموساً في اختبارات الأداء على 22 مجموعة مراجعة عامة في مجالات متعددة، مثل مهام وصف الصوت، وفهم الصوت، والأسئلة والإجابات الصوتية، والتعرف على الكلام.

وحقق زمن استجابة للرمز الأول في الاستدلال الأحادي لا يتجاوز ربع زمن النماذج المتقدمة الأخرى، مع قدرة معالجة متزامنة تزيد بنحو 20 ضعفاً عند العمل تحت نفس حجم الذاكرة الرسومية، مما يمنح نموذج شاومي تفوقاً في الأداء.

معالجة صوتية دقيقة

وأظهر النموذج الجديد تفوقاً واضحاً في معايير X-ARES، متجاوزاً نماذج مثل Whisper وKimi-Audio من حيث الفهم العام، خاصة في المهام غير المرتبطة بالكلام. 

ويستخدم Dasheng كذلك في مهام توليد الصوت مثل تقنيات إزالة الضجيج والتعزيز السمعي، وقد تم بالفعل دمج نموذج Dasheng-Denoiser  ضمن مؤتمرات دولية مثل Interspeech 2025، حيث يتم تحويل التمثيلات الصوتية المستخرجة من الكلام المليء بالضوضاء إلى صوت نقي باستخدام تقنيات ترميز موجهة وشبكات استعادة صوت متقدمة.

من حيث الكفاءة الحسابية، يتفوق MiDashengLM في سرعة الاستدلال، حيث يمكنه، على سبيل المثال، معالجة دفعات تصل إلى 512 عينة صوتية بطول 30 ثانية ضمن بيئة ذاكرة 80 جيجابايت، في حين تعاني نماذج أخرى من تجاوز الذاكرة عند وصولها إلى دفعات بحجم 16 عينة صوتية فقط. 

وقد ساعد هذا الأداء على تقليل معدل الإطارات الخارجة من المشفر الصوتي من 25 هرتز إلى 5 هرتز، مما أدى إلى انخفاض كبير في القوة الحاسوبية المطلوبة بنسبة وصلت إلى 80%.

أما على مستوى البيانات، فقد بُني النموذج بالكامل باستخدام بيانات عامة المصدر بنسبة 100%، بواقع 1.1 مليون ساعة موزعة على مجالات متعددة تشمل التعرف على الكلام، وفهم الأصوات المحيطية، وتحليل الموسيقى، والسلوكيات الصوتية غير الكلامية، والمهام التفاعلية القائمة على الأسئلة والأجوبة.

وتكمن قوة نموذج MiDashengLM في التغيير الجذري بطريقة معالجة البيانات الصوتية، إذ تم التخلي عن أساليب تحويل الكلام التقليدية (ASR) لصالح آليات محاذاة وصفية شاملة تدمج كل أنواع المحتوى السمعي، بما في ذلك الأصوات البيئية والموسيقية، مما سمح بتقليل فقدان البيانات المفيدة، والذي كانت تتسبب فيه تقنيات ASR بنسبة تصل إلى 90%.

ويمتلك النموذج إمكانات واسعة التطبيق، منها تقديم تعليقات مخصصة للمستخدمين أثناء التدريب الصوتي أو تعلم اللغات الأجنبية، وتقديم ملاحظات فورية أثناء قيادة السيارة، إلى جانب استخدامه كمساعد ذكي للإجابة على الأسئلة المتعلقة بالأصوات البيئية. 

كما تخطط شاومي لتوسيع هذا النموذج نحو دعم العمل غير المتصل بالإنترنت على الأجهزة الطرفية، مع تعزيز قدرات التحرير الصوتي استنادًا إلى أوامر اللغة الطبيعية.

وإلى جانب تفوقه التقني، يتسم النموذج بشفافية كاملة، حيث كشفت شاومي عن كافة تفاصيل البيانات المستخدمة، بما في ذلك نسب التوزيع لـ77 مصدراً، وتفاصيل المراحل التدريبية من مرحلة التهيئة الأولية للمشفر الصوتي إلى الضبط النهائي للأوامر. 

وقد أُصدر النموذج برخصة Apache 2.0، ما يتيح دمجه في المنتجات التجارية أو استخدامه في البحث العلمي بحرية تامة، كما دعت الشركة الصينية مجتمع المطورين للمشاركة في تطويره عبر منصة GitHub ضمن فلسفة الانفتاح والشفافية والمجتمع التعاوني.



Source link

شاركها. تويتر
السابقبعد 15 عاماً… شقيق أصالة نصري يوثق لحظة لقائه بابنته في سوريا (فيديو)
التالي كرم: على الدولة الآن حسم أمرها والذهاب الى التنفيذ
admin
  • موقع الويب

المقالات ذات الصلة

علماء: 2025 شهد ثالث أكثر شهور يوليو حرارة على الأرض

أغسطس 7, 2025

ترمب يهدد بفرض رسوم جمركية 100% على واردات رقائق إلكترونية

أغسطس 7, 2025

صندوق النرويج السيادي يقر بقصور التدقيق باستثمارات بإسرائيل

أغسطس 6, 2025
اترك تعليقاً إلغاء الرد

الشرق الأوسط

78 % من السعوديين يفضلون السفر الفردي

يونيو 26, 2025

مخاوف من عودة نشاط المهربين على الحدود الأردنية السورية

أغسطس 2, 2025

تحركات مريبة لخلايا «داعش» داخل مخيم الهول السوري

أغسطس 1, 2025

«الكابينت» يحسم خلاف نتنياهو والجيش في جلسة تعلق بها الأنظار

أغسطس 6, 2025
آسيا
آسيا أغسطس 7, 2025

يبتلع أعضاء مجلس الشيوخ الأمريكيون إنذارًا على مخاطر الأمن في ديبسيك

وقد دعا سبعة من أعضاء مجلس الشيوخ الجمهوريين في الولايات المتحدة إلى إجراء تحقيق في…

لماذا كونك جنديًا رائعًا مرة أخرى في الغرب

أغسطس 7, 2025

قد يحدث اجتماع ترامب بوتين وجهاً لوجه قريبًا

أغسطس 7, 2025
الأكثر مشاهدة

دلال كرم وعاصي الرحباني وزوجته… القصة الكاملة مع زياد الرحباني

يوليو 30, 20259 زيارة

78 % من السعوديين يفضلون السفر الفردي

يونيو 26, 20258 زيارة

والد أنغام يكشف تفاصيل حالتها الصحية

أغسطس 6, 20255 زيارة
اختيارات المحرر

حلا الترك تغني باللهجة اللبنانية وتختار فيروز (فيديو)

أغسطس 7, 2025

تقرير يكشف “نظاما سريا” تستخدمه “حماس” لدفع رواتب الموظفين في غزة

أغسطس 7, 2025

غزة بين رغبات نتنياهو… والاستنزاف الطويل

أغسطس 7, 2025

مع كل متابعة جديدة

اشترك في نشرتنا الإخبارية لتبق على اطلاع بأحدث أخبارنا.

اشترك في نشرتنا الإخبارية للاطلاع على أحدث المنشورات والنصائح، لنبقى على اطلاع!

© 2025 جميع الحقوق محفوظة.
  • Home
  • DMCA
  • أعلن معنا
  • اتصل بنا
  • الشروط والأحكام
  • سياسة الخصوصية
  • من نحن

اكتب كلمة البحث ثم اضغط على زر Enter