نماذج DeepSeek R1: أنهما يضاهيان أداء نماذج التفكير المنطقي o1 من شركة OpenAI من chatgbt.
![]() |
نموذج deepseek r1 يطور نماذج شبيهة بنموذج chatgbt |
في 20 يناير 2025، أعلنت شركة DeepSeek الصينية عن إطلاق نماذجها الجديدة للذكاء الاصطناعي، R1 وR1-Zero، مدعيةً أنهما يضاهيان أداء نماذج التفكير المنطقي o1 من شركة OpenAI. تأتي هذه الخطوة في إطار التنافس المتزايد في مجال الذكاء الاصطناعي، حيث تسعى الشركات لتقديم نماذج أكثر تطورًا وفعالية.
ما هي نماذج التفكير المنطقي؟
نماذج التفكير المنطقي هي نماذج ذكاء اصطناعي تأخذ وقتًا أطول قبل الرد، حيث تستخدم عملية تفكير متسلسلة لمعالجة المشكلات والتحقق من صحة الإجابات لتجنب الأخطاء الشائعة في النماذج التقليدية. بدأت OpenAI في طرح هذا النوع من النماذج من خلال إطلاقها لنسختها الأولى o1-preview، وتبعتها شركات أخرى مثل Google بنموذجها Gemini 2.0 Flash Thinking، وDeepSeek بنموذجها R1-Lite-Preview. المميز في خطوة DeepSeek هو تقديم نسخة مفتوحة المصدر من هذا النوع من النماذج، في ظل احتفاظ OpenAI وGoogle بسرية بيانات نماذج التسلسل المنطقي الخاصة بهما.
تفاصيل نماذج DeepSeek R1 وR1-Zero
R1-Zero: التعلم المعزز دون إشراف بشري
نموذج DeepSeek-R1-Zero يتميز بطريقة تعلم مبتكرة، حيث طوّر مهاراته في الاستدلال باستخدام التعلم المعزز دون الاعتماد على أمثلة بشرية. اعتمد النموذج على نظام مكافآت مبسّط وقواعد واضحة لفحص دقة الإجابات، مثل التحقق من صحة حلول المسائل الرياضية وبرمجية التعليمات.
طوّرت DeepSeek خوارزمية جديدة تقيّم مجموعات من الإجابات بدلًا من تقييم كل إجابة على حدة، مما مكّن النموذج من تحسين أدائه بكفاءة. ومع ذلك، واجه النموذج مشكلتين رئيسيتين: صعوبة قراءة الإجابات وخلط اللغات.
R1: تحسينات على R1-Zero
لمعالجة المشكلات السابقة، أطلقت DeepSeek نموذج R1، الذي يبدأ بتدريب مبدئي على بيانات صغيرة، ثم يخضع لجولات متعددة من التعلم المعزز لتحسين الأداء. أظهرت الاختبارات أن نموذج DeepSeek-R1 حقق أداءً يقارب أداء نموذج OpenAI-o1-1217 عبر عدة معايير استدلالية تُختبر بها نماذج الذكاء الاصطناعي.
النماذج المُقطّرة: أداء قوي بحجم أصغر
طوّرت الشركة 6 نماذج صغيرة تتراوح بين 1.5 و70 مليار معلمة، باستخدام 800 ألف مثال تدريبي ولّدها نموذج R1 الأكبر. أظهرت هذه النماذج المُقطّرة، مثل R1-Distill-Llama-70B وR1-Distill-Qwen-32B، قدرات استدلالية قوية، متفوقة على العديد من النماذج الأكبر حجمًا.
التوفر والترخيص
تتوفر نماذج DeepSeek-R1 برخصة MIT، مما يسمح باستخدامها بحرية وتخصيصها وتطويرها. يمكن الوصول إلى تلك النماذج عبر منصتي GitHub وHuggingFace، أو من خلال واجهة برمجية (API) خاصة بالشركة بأسعار محددة أرخص كثيرًا من نماذج OpenAI.
التحديات والقيود
على الرغم من ميزاته، يخضع DeepSeek-R1 -مثل معظم النماذج الصينية- للتنظيم الصارم من قبل السلطات الصينية لضمان توافقه مع "القيم الاشتراكية الأساسية". هذا يعني أن النموذج يتجنب الإجابة عن أسئلة حساسة مثل أحداث ساحة تيانانمن أو استقلال تايوان. بالإضافة إلى ذلك، يأتي إطلاق R1 في وقت تشهد فيه العلاقات بين الصين والولايات المتحدة توترًا بشأن تقنيات الذكاء الاصطناعي. وقد فرضت الإدارة الأمريكية قيودًا على تصدير التكنولوجيا المتقدمة إلى الصين، مما قد يؤثر على تطور النماذج المستقبلية.
الخلاصة
يمثل إطلاق نماذج DeepSeek R1 خطوة مهمة في سباق الذكاء الاصطناعي، حيث تقدم الشركة الصينية نماذج مفتوحة المصدر تنافس أداء نماذج OpenAI. مع التحسينات المستمرة والتطوير المستمر، من المتوقع أن تستمر DeepSeek في تقديم نماذج أكثر تطورًا وفعالية في المستقبل.