تطلق شركة DeepSeek للذكاء الاصطناعي الفيروسي عائلة نماذج صور جديدة

أصدرت DeepSeek، شركة الذكاء الاصطناعي الفيروسية، مجموعة جديدة من نماذج الذكاء الاصطناعي متعددة الوسائط التي تدعي أنها يمكن أن تتفوق في الأداء على DALL-E 3 من OpenAI.
تعد النماذج المتوفرة للتنزيل من منصة تطوير الذكاء الاصطناعي Hugging Face، جزءًا من عائلة نماذج جديدة يطلق عليها DeepSeek اسم Janus Pro. وهي تتراوح في الحجم من 1 مليار معلمة إلى 7 مليار معلمة. تتوافق المعلمات تقريبًا مع مهارات حل المشكلات الخاصة بالنموذج، والنماذج التي تحتوي على معلمات أكثر تؤدي عمومًا أداءً أفضل من تلك التي تحتوي على معلمات أقل.
يخضع Janus Pro لترخيص من معهد ماساتشوستس للتكنولوجيا (MIT)، مما يعني أنه يمكن استخدامه تجاريًا دون قيود.
يمكن لـ Janus Pro، الذي يصفه DeepSeek بأنه “إطار عمل انحداري جديد”، تحليل وإنشاء صور جديدة. وفقًا للشركة، في معيارين لتقييم الذكاء الاصطناعي، GenEval وDPG-Bench، يتفوق أكبر نموذج Janus Pro، Janus Pro 7B، على DALL-E 3 بالإضافة إلى نماذج مثل PixArt-alpha، وEmu3-Gen، وStability AI’s Stable. انتشار XL.
بعض هذه النماذج موجودة على الجانب الأقدم. ويمكن لـ Janus Pro فقط تحليل وإنشاء صور صغيرة – صور بدقة 384 × 384. لكن أداء عائلة Janus Pro مثير للإعجاب، مع الأخذ في الاعتبار الأحجام الصغيرة للنماذج.
كتب DeepSeek في منشور على Hugging Face: “يتفوق برنامج Janus Pro على النموذج الموحد السابق ويطابق أداء النماذج الخاصة بالمهمة أو يتجاوزها”. “إن بساطة Janus Pro ومرونته العالية وفعاليته تجعله مرشحًا قويًا للجيل القادم من النماذج الموحدة متعددة الوسائط.”

DeepSeek، وهو مختبر صيني للذكاء الاصطناعي تموله إلى حد كبير شركة التداول الكمي High-Flyer Capital Management، اقتحم الوعي السائد هذا الأسبوع بعد أن ارتفع تطبيق chatbot الخاص به إلى قمة قوائم متجر تطبيقات Apple. دفعت نماذج لغة DeepSeek، التي تم تدريبها باستخدام تقنيات حسابية فعالة، العديد من المحللين – والتقنيين في وول ستريت – إلى التساؤل عما إذا كانت الولايات المتحدة قادرة على الحفاظ على ريادتها في سباق الذكاء الاصطناعي، وما إذا كان الطلب على رقائق الذكاء الاصطناعي سيستمر.