تحديث نموذج DeepSeek يقود ثورة في الخوارزمية AI ويعيد تشكيل هيكل الصناعة

DeepSeek تقود الخوارزمية ثورة ، تعيد تشكيل صناعة الذكاء الاصطناعي

مؤخراً، أصدرت DeepSeek تحديث النسخة V3 الأحدث على منصة معروفة لمشاركة نماذج الذكاء الاصطناعي - DeepSeek-V3-0324. يتمتع هذا النموذج الذي يحتوي على 6850 مليار معلمة بتحسينات ملحوظة في قدرات الترميز وتصميم واجهة المستخدم وقدرات الاستدلال.

في المؤتمر 2025 GTC الذي انتهى للتو، قدم أحد التنفيذيين المعروفين في الشركات التكنولوجية تقييمًا عاليًا لـ DeepSeek. وأكد أن الرأي القائل بأن النموذج الفعال لـ DeepSeek سيقلل من الطلب على الشرائح عالية الأداء هو رأي خاطئ. وتوقع أن الطلب على الحوسبة في المستقبل سيزداد فقط، وليس سينخفض.

كنموذج ل突破 الخوارزمية، أثار DeepSeek العلاقة بين إمدادات الأجهزة الحاسوبية عالية الأداء مناقشات واسعة في الصناعة. دعونا نستكشف أهمية قوة الحوسبة والخوارزمية في تطوير صناعة الذكاء الاصطناعي.

قوة الحوسبة وتطور الخوارزمية المتبادل

في مجال الذكاء الاصطناعي، فإن تحسين قوة الحوسبة يوفر أساسًا لتشغيل خوارزميات أكثر تعقيدًا، مما يسمح للنماذج بمعالجة كميات أكبر من البيانات، وتعلم أنماط أكثر تعقيدًا؛ بينما يمكن أن يؤدي تحسين الخوارزمية إلى استخدام قوة الحوسبة بشكل أكثر كفاءة، مما يعزز من كفاءة استخدام موارد الحوسبة.

علاقة التعايش بين قوة الحوسبة والخوارزمية تعيد تشكيل مشهد صناعة الذكاء الاصطناعي:

  1. تباين المسارات التقنية: بعض الشركات تسعى لبناء تجمعات حسابية ضخمة، بينما تركز أخرى على تحسين كفاءة الخوارزمية، مما يؤدي إلى تشكيل تيارات تقنية مختلفة.

  2. إعادة هيكلة سلسلة الصناعة: بعض الشركات المصنعة للأجهزة أصبحت رائدة في قوة الذكاء الاصطناعي من خلال النظام البيئي، بينما خفض مقدمو الخدمات السحابية عتبة النشر من خلال خدمات القوة المرنة.

  3. تعديل تخصيص الموارد: تسعى الشركات لتحقيق توازن بين استثمار البنية التحتية للأجهزة وتطوير الخوارزمية الفعالة.

  4. ظهور المجتمع المفتوح المصدر: نماذج مفتوحة المصدر مثل DeepSeek و LLaMA تتيح مشاركة ابتكارات الخوارزمية ونتائج تحسين القدرة الحاسوبية، مما يسرع من تكرار التكنولوجيا وانتشارها.

من مسابقة قوة الحوسبة إلى ثورة الخوارزمية: نموذج جديد للذكاء الاصطناعي تقوده DeepSeek

الابتكارات التقنية لـ DeepSeek

نجاح DeepSeek مرتبط ارتباطًا وثيقًا بالابتكار التكنولوجي الخاص بها. فيما يلي شرح موجز لنقاط الابتكار الرئيسية لديها:

تحسين هيكل النموذج

تستخدم DeepSeek هيكلًا مركبًا من Transformer + MOE (خليط من الخبراء) ، وتقدم آلية الانتباه الكامنة متعددة الرؤوس (Multi-Head Latent Attention, MLA). يشبه هذا الهيكل فريقًا خارقًا حيث يتولى Transformer المهام العادية بينما يعمل MOE كفريق من الخبراء، حيث يتمتع كل خبير بمجال تخصص خاص به، وعند مواجهة مشكلة معينة، يقوم الخبير الأكثر كفاءة بمعالجتها، مما يزيد بشكل كبير من كفاءة ودقة النموذج. تسمح آلية MLA للنموذج بالتركيز بشكل أكثر مرونة على التفاصيل الهامة المختلفة عند معالجة المعلومات، مما يعزز أداء النموذج.

طرق التدريب革新

قدمت DeepSeek إطار عمل تدريب دقة مختلطة FP8. يشبه هذا الإطار موزع موارد ذكي، حيث يمكنه اختيار دقة الحساب المناسبة ديناميكيًا بناءً على احتياجات مراحل التدريب المختلفة. عندما تكون هناك حاجة لحسابات عالية الدقة، فإنه يستخدم دقة أعلى لضمان دقة النموذج؛ بينما عندما يمكن قبول دقة أقل، فإنه يقلل من الدقة، مما يوفر موارد الحساب، ويزيد من سرعة التدريب، ويقلل من استخدام الذاكرة.

تحسين كفاءة الاستدلال

في مرحلة الاستدلال، قدمت DeepSeek تقنية التنبؤ متعدد الرموز (Multi-token Prediction, MTP). الطريقة التقليدية للاستدلال تتم خطوة بخطوة، حيث يتم التنبؤ برمز واحد فقط في كل خطوة. بينما تتيح تقنية MTP التنبؤ بعدة رموز دفعة واحدة، مما يسرع بشكل كبير من سرعة الاستدلال، ويقلل أيضًا من تكلفة الاستدلال.

###突破 الخوارزمية التعلم المعزز

تحسن الخوارزمية الجديدة للتعلم المعزز GRPO (تحسين مكافأة-عقوبة عام) من DeepSeek عملية تدريب النموذج. يعتبر التعلم المعزز كأنماط من المدربين للنموذج، حيث يقوم المدرب بتوجيه النموذج لتعلم سلوكيات أفضل من خلال المكافآت والعقوبات. قد تستهلك الخوارزميات التقليدية للتعلم المعزز الكثير من الموارد الحاسوبية في هذه العملية، بينما الخوارزمية الجديدة لـ DeepSeek أكثر كفاءة، حيث يمكنها تقليل الحسابات غير الضرورية مع ضمان تحسين أداء النموذج، وبالتالي تحقيق توازن بين الأداء والتكلفة.

تشكل هذه الابتكارات نظامًا تقنيًا كاملًا، يقلل من متطلبات قوة الحوسبة على طول سلسلة التدريب إلى الاستدلال. يمكن الآن لبطاقات الرسوميات الاستهلاكية العادية تشغيل نماذج الذكاء الاصطناعي القوية، مما خفض بشكل كبير من عتبة تطبيق الذكاء الاصطناعي، مما يتيح لمزيد من المطورين والشركات المشاركة في الابتكار في مجال الذكاء الاصطناعي.

تأثير على شركات تصنيع الأجهزة الحاسوبية عالية الأداء

يعتقد الكثيرون أن DeepSeek قد تجاوزت بعض طبقات الأجهزة، مما أخرجها من الاعتماد على شركات معينة. في الواقع، يقوم DeepSeek بتحسين الخوارزمية مباشرة من خلال مجموعة التعليمات الأساسية. هذه الطريقة تمكن من تحقيق تحسينات أكثر دقة في الأداء.

إن تأثير ذلك على شركات تصنيع أجهزة الحاسوب عالية الأداء ذو شقين. من ناحية، فإن DeepSeek مرتبط في الواقع بمنتجات شركات الأجهزة ونظامها البيئي بشكل أعمق، كما أن انخفاض عتبة تطبيقات الذكاء الاصطناعي قد يؤدي إلى توسيع حجم السوق الكلي؛ ومن ناحية أخرى، قد تؤدي تحسينات DeepSeek في الخوارزمية إلى تغيير هيكل الطلب في السوق على الشرائح المتطورة، حيث يمكن الآن تشغيل بعض نماذج الذكاء الاصطناعي التي كانت تحتاج في السابق إلى وحدات معالجة رسومات عالية الجودة بكفاءة على بطاقات الرسوميات المتوسطة أو حتى المبتدئة.

أهمية صناعة الذكاء الاصطناعي في الصين

تقدم تحسينات الخوارزمية في DeepSeek مسارًا تقنيًا للانفصال عن القيود التي يواجهها قطاع الذكاء الاصطناعي في الصين. في ظل القيود المفروضة على الرقائق عالية الأداء، خفف التفكير القائل "البرمجيات تعوض عن الأجهزة" من الاعتماد على الرقائق المستوردة من الدرجة الأولى.

في المرحلة العليا، قامت الخوارزمية الفعالة بتخفيض ضغط متطلبات القدرة الحاسوبية، مما مكن مقدمي خدمات القدرة الحاسوبية من تمديد دورة استخدام الأجهزة من خلال تحسين البرمجيات، وزيادة عائد الاستثمار. في المرحلة السفلى، خفض النموذج المفتوح المصدر المحسن من عتبة تطوير تطبيقات الذكاء الاصطناعي. يمكن للعديد من الشركات الصغيرة والمتوسطة، دون الحاجة إلى موارد كبيرة من القدرة الحاسوبية، تطوير تطبيقات تنافسية استنادًا إلى نموذج DeepSeek، مما سيؤدي إلى ظهور المزيد من حلول الذكاء الاصطناعي في المجالات الرأسية.

التأثير العميق على Web3 + AI

بنية تحتية للذكاء الاصطناعي اللامركزي

تقدم تحسينات خوارزمية DeepSeek دفعة جديدة للبنية التحتية للذكاء الاصطناعي Web3، حيث تجعل البنية المبتكرة والخوارزميات الفعالة واحتياجات القدرة الحاسوبية المنخفضة الاستنتاج اللامركزي للذكاء الاصطناعي ممكنًا. هيكل MoE مناسب بشكل طبيعي للنشر الموزع، حيث يمكن أن تمتلك العقد المختلفة شبكات خبراء مختلفة، دون الحاجة إلى تخزين النموذج الكامل في عقدة واحدة، مما يقلل بشكل ملحوظ من متطلبات التخزين والحساب لعقدة واحدة، وبالتالي يزيد من مرونة وكفاءة النموذج.

إطار تدريب FP8 يقلل بشكل أكبر من الحاجة إلى موارد الحوسبة المتطورة، مما يسمح بمزيد من موارد الحوسبة للانضمام إلى شبكة العقد. هذا لا يقلل فقط من عتبة المشاركة في الحوسبة اللامركزية للذكاء الاصطناعي، بل يزيد أيضًا من قدرة وكفاءة الحوسبة في الشبكة بأكملها.

أنظمة متعددة الوكلاء

  1. تحسين استراتيجيات التداول الذكية: من خلال تحليل بيانات السوق في الوقت الفعلي، وتنبؤ تقلبات الأسعار على المدى القصير، وتنفيذ التداولات على السلسلة، ومراقبة نتائج التداول، تساعد تشغيل عدة وكلاء متعاونين المستخدمين على تحقيق عوائد أعلى.

  2. التنفيذ الآلي للعقود الذكية: مراقبة العقود الذكية، تنفيذ العقود الذكية، الإشراف على نتائج التنفيذ، وغيرها من العمليات التعاونية للوكيل، لتحقيق أتمتة منطق العمل الأكثر تعقيدًا.

  3. إدارة المحافظ الاستثمارية المخصصة: تساعد الذكاء الاصطناعي المستخدمين في البحث عن أفضل فرص الرهن أو توفير السيولة في الوقت الفعلي بناءً على تفضيلات المخاطر وأهداف الاستثمار والحالة المالية للمستخدم.

تسعى DeepSeek إلى إيجاد突破 من خلال الابتكار في الخوارزميات تحت قيود القدرة الحاسوبية، مما يفتح مسارات تطوير متميزة لصناعة الذكاء الاصطناعي في الصين. تقليل عوائق التطبيق، وتعزيز دمج Web3 والذكاء الاصطناعي، وتقليل الاعتماد على الرقائق عالية الأداء، وتمكين الابتكار المالي، هذه التأثيرات تعيد تشكيل ملامح الاقتصاد الرقمي. في المستقبل، لن يكون تطوير الذكاء الاصطناعي مجرد سباق على القدرة الحاسوبية، بل سيكون سباقًا للتعاون بين القدرة الحاسوبية والخوارزمية. في هذا المسار الجديد، يقوم المبتكرون مثل DeepSeek بإعادة تعريف قواعد اللعبة باستخدام الحكمة الصينية.

DEEPSEEK-1.53%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • مشاركة
تعليق
0/400
DataPickledFishvip
· منذ 11 س
قوة الحوسبة必须跟上趋势
شاهد النسخة الأصليةرد0
LiquidationWatchervip
· 07-31 14:38
طلب الرقائق صاعد كثيراً
شاهد النسخة الأصليةرد0
WalletsWatchervip
· 07-31 14:34
قوة الحوسبة要求真不低
شاهد النسخة الأصليةرد0
fomo_fightervip
· 07-31 14:31
ارتفع ارتفع ارتفع كل المعلومات المفضلة
شاهد النسخة الأصليةرد0
metaverse_hermitvip
· 07-31 14:22
كلما تم تحسينه، زادت قوة الحوسبة المطلوبة.
شاهد النسخة الأصليةرد0
  • تثبيت