به گزارش خبرآنلاین، مدلهای مولد تصویر و چندوجهی جدید که برای دانلود در Hugging Face قرار گرفتهاند، Janus-Pro نام دارند. اندازه این مدلها از ۱ میلیارد تا ۷ میلیارد پارامتر متغیر است. مقدار پارامترها تقریباً با مهارتهای حل مسئله یک مدل مطابقت دارند و مدلهایی با پارامترهای بیشتر معمولاً بهتر از مدلهایی با پارامترهای کمتر عمل میکنند.
به نقل از دیجیاتو، مدلهای متنباز Janus-Pro تحت مجوز MIT منتشر شدهاند، به این معنی که میتوان از آنها به صورت تجاری و بدون محدودیت استفاده کرد. سال گذشته میلادی این شرکت مدلهای چندوجهی Janus را نیز منتشر کرده بود.
مدل Janus-Pro، که DeepSeek آن را به عنوان یک «فریمورک اتورگرسیو جدید» توصیف میکند، میتواند تصاویر را تجزیهوتحلیل و ایجاد کند. به گفته این شرکت، بزرگترین مدل آن یعنی Janus-Pro-۷B در ۲ بنچمارک هوش مصنوعی GenEval و DPG-Bench توانسته مدلهای DALL-E ۳ ،PixArt-alpha و Stable Diffusion X را شکست بدهد.
البته برخی از مدلهای چندوجهی دیپسیک با تعداد پارامترهای کمتر نسبت به مدلهای فعلی کمی قدیمی به نظر میرسند و فقط میتوانند تصاویر کوچک را با وضوح حداکثر ۳۸۴ در ۳۸۴ پیکسل تجزیهوتحلیل کنند. اما عملکرد Janus-Pro باتوجهبه اندازههای فشرده مدلها قابلتوجه است. این شرکت چینی میگوید که سرعت و دقت ارائه خروجی نسخه مدل بزرگتر آن، با حداکثر ۷ میلیارد پارامتر، نسبت به نسل قبل بهبود یافته است.
شرکت چینی DeepSeek این هفته پس از اینکه اپلیکیشن iOS آن در صدر جدول برنامههای اپ استور اپل قرار گرفت، توجه بسیاری از افراد را جلب کرد. مدلهای زبانی DeepSeek که با استفاده از تکنیکهای محاسباتی کارآمد آموزش داده شدهاند، باعث شده بسیاری از تحلیلگران والاستریت این سؤال را مطرح کنند که آیا آمریکا میتواند پیشتازی خود را در رقابت هوش مصنوعی حفظ کند و آیا تقاضا برای تراشههای هوش مصنوعی ادامه خواهد داشت یا خیر.
۵۸۵۸
نظر شما