يقول AI2 عن طراز الذكاء الاصطناعى الجديد يتفوق على أحد أفضل ما في ديبسيك

30 يناير, 2025

يقول AI2 عن طراز الذكاء الاصطناعى الجديد يتفوق على أحد أفضل ما في ديبسيك

تقنية Ai2, أحد, أفضل, الاصطناعى, الجديد, الذكاء, ديبسيك, طراز, على, عن, في, ما, يتفوق, يقول

تحرك ، ديبسيك. هناك بطل جديد لمنظمة العفو الدولية في المدينة – وهم أمريكيون.

في يوم الخميس ، أصدر AI2 ، وهو معهد أبحاث منظمة العفو الدولية غير الربحية مقره في سياتل ، نموذجًا يزعم أنه يتفوق على Deepseek V3 ، أحد أنظمة Deepseek الصينية الرائدة في شركة AI.

نموذج AI2 ، المسمى Tulu3-405b ، يتفوق أيضًا على GPT-4O من Openai على معايير AI معينة ، وفقًا للاختبار الداخلي لـ AI2. علاوة على ذلك ، على عكس GPT-4O (وحتى Deepseek V3) ، فإن Tulu3-405B هو مفتوح المصدر ، مما يعني أن جميع المكونات اللازمة لتكرارها من نقطة الصفر متاحة مجانًا وترخيصًا.

وقال متحدث باسم AI2 لـ TechCrunch إن المختبر يعتقد أن Tulu3-405B “يؤكد على إمكانية قيادة التطوير العالمي لنماذج الذكاء الاصطناعي الأفضل في فئة الفئة”.

وقال المتحدث باسم المتحدث: “هذا المعلم هو لحظة رئيسية لمستقبل AI المفتوح ، مما يعزز موقف الولايات المتحدة كقائد في النماذج التنافسية المفتوحة المصدر”. “مع هذا الإطلاق ، تقدم AI2 بديلاً قويًا ومطورًا في الولايات المتحدة لنماذج Deepseek-مما يمثل لحظة محورية ليس فقط في تطور الذكاء الاصطناعي ، ولكن في عرض أن الولايات المتحدة يمكن أن تقودها مع AI تنافسية مفتوحة المصدر مستقل عن العمالقة التكنولوجية. “

Tulu3-405b هو نموذج كبير إلى حد ما. تحتوي على 405 مليار معلمة ، وتتطلب 256 وحدات معالجة الرسومات التي تعمل بالتوازي للتدريب ، وفقا ل AI2. تتوافق المعلمات تقريبًا مع مهارات حل المشكلات في النموذج ، وتؤدي النماذج ذات المعلمات بشكل عام بشكل أفضل من تلك التي تحتوي على معلمات أقل.

اختبرت AI2 TULU3-405B على عدد من المعايير ، بما في ذلك اختبارات الرياضيات والمعرفة العامة. ائتمانات الصورة:AI2

وفقًا لـ AI2 ، كان أحد مفاتيح الوصول إلى الأداء التنافسي مع Tulu3-405B بمثابة تقنية تسمى التعلم التعزيز بمكافآت يمكن التحقق منها. التعلم التعزيز مع المكافآت التي يمكن التحقق منها ، أو RLVR ، تدرب نماذج على المهام مع نتائج “يمكن التحقق منها” ، مثل حل مشاكل الرياضيات والتعليمات التالية.

تدعي AI2 أنه في المعيار Popqa ، مجموعة من 14000 من أسئلة المعرفة المتخصصة التي يتم الحصول عليها من ويكيبيديا ، Tulu3-405B لا تغلب فقط على Deepseek V3 و GPT-4O ، ولكن أيضًا نموذج LLAMA’s LLAMA 3.1 405B. كان لدى Tulu3-405B أيضًا أعلى أداء لأي نموذج في فصله على GSM8K ، وهو اختبار يحتوي على مشاكل في كلمات الرياضيات على مستوى المدرسة.

يتوفر TULU3-405B للاختبار عبر تطبيق ChatBot الخاص بـ AI2 ، والرمز المطلوب تدريبه وضبطه على GitHub. احصل عليه بينما يكون الجو حارًا-قبل أن يأتي نموذج الذكاء الاصطناعي الرائد المرجعية.

يقول AI2 عن طراز الذكاء الاصطناعى الجديد يتفوق على أحد أفضل ما في ديبسيك

مرتبط

اترك ردإلغاء الرد