Close Menu
  • بيت
  • آسيا
  • كرة القدم
  • أخبار عامة
  • أحدث الأخبار
  • أخبار LFG
  • سوق
    • الشرق الأوسط
  • سياسي
  • عالم
  • الرياضة
  • أخبار المشاهير العرب

اشترك في نشرتنا الإلكترونية مجاناً

اشترك في نشرتنا الإخبارية لتبق على اطلاع بأحدث أخبارنا.

اشترك في نشرتنا الإخبارية للاطلاع على أحدث المنشورات والنصائح، لنبقى على اطلاع!

اختيارات المحرر

كأس الملك.. صراع أول بين الهلال والأخدود

أكتوبر 28, 2025

السعودية وباكستان تتفقان على إطلاق إطار تعاون اقتصادي

أكتوبر 28, 2025

مشرع جديد يربط إسرائيل ومصر

أكتوبر 28, 2025
فيسبوك X (Twitter) الانستغرام
الثلاثاء, أكتوبر 28, 2025
  • Home
  • DMCA
  • أعلن معنا
  • اتصل بنا
  • الشروط والأحكام
  • سياسة الخصوصية
  • من نحن
Kinstrak News | كنستراك نيوزKinstrak News | كنستراك نيوز
  • بيت
  • آسيا
  • كرة القدم
  • أخبار عامة
  • أحدث الأخبار
  • أخبار LFG
  • سوق
    • الشرق الأوسط
  • سياسي
  • عالم
  • الرياضة
  • أخبار المشاهير العرب
Kinstrak News | كنستراك نيوزKinstrak News | كنستراك نيوز
أنت الآن تتصفح:Home » يستوعب المشاعر.. شاومي تكشف عن نموذج ذكي لإنشاء الأصوات
أحدث الأخبار

يستوعب المشاعر.. شاومي تكشف عن نموذج ذكي لإنشاء الأصوات

adminadminأغسطس 6, 2025لا توجد تعليقات3 دقائق
تويتر
شاركها
تويتر


أعلنت شركة شاومي عن نموذجها الصوتي الذكي الجديد مفتوح المصدر MiDashengLM‑7B، في خطوة نوعية تهدف إلى تعزيز البنية التقنية لمنصاتها في السيارات الكهربائية والأجهزة المنزلية الذكية، وذلك كامتداد مباشر لنموذجها الصوتي الأساسي Xiaomi Dasheng. 

وبحسب ما نشرته الشركة عبر شبكة ويبو الصينية، يأتي MiDashengLM‑7B كمحصلة لتطور كبير في تقنيات فهم الصوت، حيث يستند إلى معمارية صوتية متقدمة تعتمد على منصة Xiaomi Dasheng كمُشفر صوتي، إلى جانب نموذج Qwen2.5-Omni‑7B كوحدة فك ترميز يُعتمد عليها لتقديم تجربة متكاملة تتيح للنموذج فهم الكلام والأصوات البيئية والموسيقى بفاعلية موحدة. 

ويعتمد النموذج على استراتيجيات تدريب مبتكرة تعيد توصيف المشاهد الصوتية بطرق متطورة، مما يمكّنه من التقاط المعاني العميقة للمحتوى السمعي، بما يشمل مشاعر المتحدث والصدى المكاني وغيرها من الخصائص الصوتية الدقيقة التي تعجز نماذج تحويل الصوت التقليدية عن اكتشافها.

وقد أظهر النموذج تفوقاً ملموساً في اختبارات الأداء على 22 مجموعة مراجعة عامة في مجالات متعددة، مثل مهام وصف الصوت، وفهم الصوت، والأسئلة والإجابات الصوتية، والتعرف على الكلام.

وحقق زمن استجابة للرمز الأول في الاستدلال الأحادي لا يتجاوز ربع زمن النماذج المتقدمة الأخرى، مع قدرة معالجة متزامنة تزيد بنحو 20 ضعفاً عند العمل تحت نفس حجم الذاكرة الرسومية، مما يمنح نموذج شاومي تفوقاً في الأداء.

معالجة صوتية دقيقة

وأظهر النموذج الجديد تفوقاً واضحاً في معايير X-ARES، متجاوزاً نماذج مثل Whisper وKimi-Audio من حيث الفهم العام، خاصة في المهام غير المرتبطة بالكلام. 

ويستخدم Dasheng كذلك في مهام توليد الصوت مثل تقنيات إزالة الضجيج والتعزيز السمعي، وقد تم بالفعل دمج نموذج Dasheng-Denoiser  ضمن مؤتمرات دولية مثل Interspeech 2025، حيث يتم تحويل التمثيلات الصوتية المستخرجة من الكلام المليء بالضوضاء إلى صوت نقي باستخدام تقنيات ترميز موجهة وشبكات استعادة صوت متقدمة.

من حيث الكفاءة الحسابية، يتفوق MiDashengLM في سرعة الاستدلال، حيث يمكنه، على سبيل المثال، معالجة دفعات تصل إلى 512 عينة صوتية بطول 30 ثانية ضمن بيئة ذاكرة 80 جيجابايت، في حين تعاني نماذج أخرى من تجاوز الذاكرة عند وصولها إلى دفعات بحجم 16 عينة صوتية فقط. 

وقد ساعد هذا الأداء على تقليل معدل الإطارات الخارجة من المشفر الصوتي من 25 هرتز إلى 5 هرتز، مما أدى إلى انخفاض كبير في القوة الحاسوبية المطلوبة بنسبة وصلت إلى 80%.

أما على مستوى البيانات، فقد بُني النموذج بالكامل باستخدام بيانات عامة المصدر بنسبة 100%، بواقع 1.1 مليون ساعة موزعة على مجالات متعددة تشمل التعرف على الكلام، وفهم الأصوات المحيطية، وتحليل الموسيقى، والسلوكيات الصوتية غير الكلامية، والمهام التفاعلية القائمة على الأسئلة والأجوبة.

وتكمن قوة نموذج MiDashengLM في التغيير الجذري بطريقة معالجة البيانات الصوتية، إذ تم التخلي عن أساليب تحويل الكلام التقليدية (ASR) لصالح آليات محاذاة وصفية شاملة تدمج كل أنواع المحتوى السمعي، بما في ذلك الأصوات البيئية والموسيقية، مما سمح بتقليل فقدان البيانات المفيدة، والذي كانت تتسبب فيه تقنيات ASR بنسبة تصل إلى 90%.

ويمتلك النموذج إمكانات واسعة التطبيق، منها تقديم تعليقات مخصصة للمستخدمين أثناء التدريب الصوتي أو تعلم اللغات الأجنبية، وتقديم ملاحظات فورية أثناء قيادة السيارة، إلى جانب استخدامه كمساعد ذكي للإجابة على الأسئلة المتعلقة بالأصوات البيئية. 

كما تخطط شاومي لتوسيع هذا النموذج نحو دعم العمل غير المتصل بالإنترنت على الأجهزة الطرفية، مع تعزيز قدرات التحرير الصوتي استنادًا إلى أوامر اللغة الطبيعية.

وإلى جانب تفوقه التقني، يتسم النموذج بشفافية كاملة، حيث كشفت شاومي عن كافة تفاصيل البيانات المستخدمة، بما في ذلك نسب التوزيع لـ77 مصدراً، وتفاصيل المراحل التدريبية من مرحلة التهيئة الأولية للمشفر الصوتي إلى الضبط النهائي للأوامر. 

وقد أُصدر النموذج برخصة Apache 2.0، ما يتيح دمجه في المنتجات التجارية أو استخدامه في البحث العلمي بحرية تامة، كما دعت الشركة الصينية مجتمع المطورين للمشاركة في تطويره عبر منصة GitHub ضمن فلسفة الانفتاح والشفافية والمجتمع التعاوني.



Source link

شاركها. تويتر
السابقبعد 15 عاماً… شقيق أصالة نصري يوثق لحظة لقائه بابنته في سوريا (فيديو)
التالي كرم: على الدولة الآن حسم أمرها والذهاب الى التنفيذ
admin
  • موقع الويب

المقالات ذات الصلة

السعودية وباكستان تتفقان على إطلاق إطار تعاون اقتصادي

أكتوبر 28, 2025

ستارمر: عقوبات ترمب على روسيا تُظهر تحسناً في وضع أوكرانيا

أكتوبر 28, 2025

ترمب يسحب مرشحه لمنصب مساعد وزير الخارجية لشؤون الشرق الأوسط

أكتوبر 28, 2025
اترك تعليقاً إلغاء الرد

الشرق الأوسط

78 % من السعوديين يفضلون السفر الفردي

يونيو 26, 2025

رحيل الممثلة كلوديا كاردينالي عن 87 عاماً… «أجمل إيطالية في تونس»

سبتمبر 24, 2025

عارض صحي مفاجئ يستدعي نقل هانيبال القذافي للمستشفى

أكتوبر 2, 2025

لقاء محمد رمضان بـ«عائلة ترمب» يلقى اهتماماً في مصر

أغسطس 9, 2025
آسيا
آسيا أكتوبر 28, 2025

ترامب وشي وسياسة السلام التكتيكي

فالدبلوماسية، عندما يتم تجريدها من المراسم والمصافحات، تتعلق في واقع الأمر بالنفوذ. وهذا الأسبوع في…

اختبار طاعة أوروبا: شركة صينية واحدة وطلب أمريكي واحد

أكتوبر 28, 2025

يهدف إحياء المدفع الكهرومغناطيسي الأمريكي إلى مواجهة التهديدات الصاروخية والطائرات بدون طيار المتزايدة في الصين

أكتوبر 28, 2025
الأكثر مشاهدة

دلال كرم وعاصي الرحباني وزوجته… القصة الكاملة مع زياد الرحباني

يوليو 30, 202529 زيارة

منح وزير الموارد البشرية صلاحية تحديد رسوم عمل المرافقين

سبتمبر 24, 202514 زيارة

78 % من السعوديين يفضلون السفر الفردي

يونيو 26, 20258 زيارة
اختيارات المحرر

كأس الملك.. صراع أول بين الهلال والأخدود

أكتوبر 28, 2025

السعودية وباكستان تتفقان على إطلاق إطار تعاون اقتصادي

أكتوبر 28, 2025

مشرع جديد يربط إسرائيل ومصر

أكتوبر 28, 2025

مع كل متابعة جديدة

اشترك في نشرتنا الإخبارية لتبق على اطلاع بأحدث أخبارنا.

اشترك في نشرتنا الإخبارية للاطلاع على أحدث المنشورات والنصائح، لنبقى على اطلاع!

© 2025 جميع الحقوق محفوظة.
  • Home
  • DMCA
  • أعلن معنا
  • اتصل بنا
  • الشروط والأحكام
  • سياسة الخصوصية
  • من نحن

اكتب كلمة البحث ثم اضغط على زر Enter