يقول AI2 عن طراز الذكاء الاصطناعى الجديد يتفوق على أحد أفضل ما في ديبسيك
تقنية Ai2, أحد, أفضل, الاصطناعى, الجديد, الذكاء, ديبسيك, طراز, على, عن, في, ما, يتفوق, يقول
تحرك ، ديبسيك. هناك بطل جديد لمنظمة العفو الدولية في المدينة – وهم أمريكيون.
في يوم الخميس ، أصدر AI2 ، وهو معهد أبحاث منظمة العفو الدولية غير الربحية مقره في سياتل ، نموذجًا يزعم أنه يتفوق على Deepseek V3 ، أحد أنظمة Deepseek الصينية الرائدة في شركة AI.
نموذج AI2 ، المسمى Tulu3-405b ، يتفوق أيضًا على GPT-4O من Openai على معايير AI معينة ، وفقًا للاختبار الداخلي لـ AI2. علاوة على ذلك ، على عكس GPT-4O (وحتى Deepseek V3) ، فإن Tulu3-405B هو مفتوح المصدر ، مما يعني أن جميع المكونات اللازمة لتكرارها من نقطة الصفر متاحة مجانًا وترخيصًا.
وقال متحدث باسم AI2 لـ TechCrunch إن المختبر يعتقد أن Tulu3-405B “يؤكد على إمكانية قيادة التطوير العالمي لنماذج الذكاء الاصطناعي الأفضل في فئة الفئة”.
وقال المتحدث باسم المتحدث: “هذا المعلم هو لحظة رئيسية لمستقبل AI المفتوح ، مما يعزز موقف الولايات المتحدة كقائد في النماذج التنافسية المفتوحة المصدر”. “مع هذا الإطلاق ، تقدم AI2 بديلاً قويًا ومطورًا في الولايات المتحدة لنماذج Deepseek-مما يمثل لحظة محورية ليس فقط في تطور الذكاء الاصطناعي ، ولكن في عرض أن الولايات المتحدة يمكن أن تقودها مع AI تنافسية مفتوحة المصدر مستقل عن العمالقة التكنولوجية. “
Tulu3-405b هو نموذج كبير إلى حد ما. تحتوي على 405 مليار معلمة ، وتتطلب 256 وحدات معالجة الرسومات التي تعمل بالتوازي للتدريب ، وفقا ل AI2. تتوافق المعلمات تقريبًا مع مهارات حل المشكلات في النموذج ، وتؤدي النماذج ذات المعلمات بشكل عام بشكل أفضل من تلك التي تحتوي على معلمات أقل.
وفقًا لـ AI2 ، كان أحد مفاتيح الوصول إلى الأداء التنافسي مع Tulu3-405B بمثابة تقنية تسمى التعلم التعزيز بمكافآت يمكن التحقق منها. التعلم التعزيز مع المكافآت التي يمكن التحقق منها ، أو RLVR ، تدرب نماذج على المهام مع نتائج “يمكن التحقق منها” ، مثل حل مشاكل الرياضيات والتعليمات التالية.
تدعي AI2 أنه في المعيار Popqa ، مجموعة من 14000 من أسئلة المعرفة المتخصصة التي يتم الحصول عليها من ويكيبيديا ، Tulu3-405B لا تغلب فقط على Deepseek V3 و GPT-4O ، ولكن أيضًا نموذج LLAMA’s LLAMA 3.1 405B. كان لدى Tulu3-405B أيضًا أعلى أداء لأي نموذج في فصله على GSM8K ، وهو اختبار يحتوي على مشاكل في كلمات الرياضيات على مستوى المدرسة.
يتوفر TULU3-405B للاختبار عبر تطبيق ChatBot الخاص بـ AI2 ، والرمز المطلوب تدريبه وضبطه على GitHub. احصل عليه بينما يكون الجو حارًا-قبل أن يأتي نموذج الذكاء الاصطناعي الرائد المرجعية.