نگار علی- در حالی که رقابت میان غولهای فناوری برای تسلط بر عرصه هوش مصنوعی مولد شدت گرفته، شرکت متا از سه مدل جدید Llama 4 رونمایی کرده است؛ مجموعهای از مدلهای پیشرفته که بناست استانداردهای جدیدی در زمینه پردازش زبان، چندرسانهای و قدرت محاسباتی تعریف کنند. مارک زاکربرگ، مدیرعامل متا، در اظهارنظری بلندپروازانه گفته است که مدل Behemoth، قویترین عضو این خانواده که هنوز بهطور رسمی عرضه نشده، «قویترین مدل پایه هوش مصنوعی جهان» خواهد بود. در ادامه، نگاهی داریم به مشخصات، تواناییها و حواشی این سه مدل جدید:
متا از سه مدل جدید Llama 4 رونمایی کرد
شرکت متا، مالک پلتفرمهای فیسبوک و اینستاگرام، با رونمایی از سه مدل جدید هوش مصنوعی تحت عنوان Llama 4، گام مهمی در رقابت جهانی هوش مصنوعی مولد برداشته است. به گفته مارک زاکربرگ، مدیرعامل این شرکت، یکی از این مدلها با نام Llama 4 Behemoth، هنوز عرضه نشده و در حال آموزش است، اما قرار است به «قویترین مدل پایه هوش مصنوعی جهان» تبدیل شود.
در حال حاضر، دو مدل دیگر به نامهای Llama 4 Scout و Llama 4 Maverick در دسترس توسعهدهندگان و پژوهشگران قرار گرفتهاند.
Scout؛ مدل سبک و سریع Llama 4
مدل Scout کوچکترین عضو این خانواده است، اما از نظر سرعت پردازش، عملکرد بسیار بالایی دارد. این مدل از ۱۰۹ میلیارد پارامتر برخوردار است و با بهرهگیری از ساختار Mixture of Experts (MoE) که شامل ۱۶ متخصص در حوزههای مختلف است، میتواند وظایف پیچیدهای مانند خلاصهسازی چندین سند، تحلیل فعالیتهای گسترده کاربران و استدلال بر روی پایگاههای وسیع کد را انجام دهد.
یکی از ویژگیهای مهم Scout، پشتیبانی از پنجره متنی ۱۰ میلیون توکن است؛ به این معنا که میتواند معادل ۸ میلیون کلمه انگلیسی را پردازش و خلاصهسازی کند.
Maverick؛ مدلی مولتیمدال با ۴۰۰ میلیارد پارامتر
مدل بزرگتر Llama 4 Maverick با ۱۲۸ متخصص و ۴۰۰ میلیارد پارامتر طراحی شده و توانایی پردازش همزمان متن، تصویر، ویدیو و صدا را دارد. به گفته متا، Maverick در آزمونهای کدنویسی، استدلال، پشتیبانی از زبانهای گوناگون، پردازش متون بلند و تصاویر، عملکردی برتر از مدلهای مطرحی مانند GPT-4o و Gemini 2.0 داشته و حتی در رقابت با مدل عظیم DeepSeek v3.1 نیز توانسته نتایج قابلتوجهی کسب کند.
Behemoth؛ غول هوش مصنوعی در راه است
مدل Llama 4 Behemoth که هنوز عرضه نشده، از ۱۶ متخصص بهره میبرد و نزدیک به دو تریلیون پارامتر دارد. طبق اعلام متا، این مدل در حوزههایی چون ریاضیات، چندزبانگی و درک تصاویر، عملکردی در سطح مدلهای پیشرفته دارد. با این حال، بررسیهای انجامشده توسط رسانه VentureBeat نشان میدهد که Behemoth در مقایسه با مدلهای DeepSeek R1 و OpenAI o1، در همه زمینهها برتری مطلق ندارد.
متنباز یا فقط «وزن باز»؟
زاکربرگ در ویدیویی در اینستاگرام اعلام کرد هدف متا از توسعه Llama 4، ساخت هوش مصنوعی پیشرو جهانی و در دسترس برای همه است. او تأکید کرد که مدلهای متنباز آینده صنعت هوش مصنوعی را شکل خواهند داد.
با این حال، برخلاف ادعای اولیه، متا این مدلها را متنباز (open source) نمینامد، بلکه آنها را وزن باز (open weight) میخواند، چراکه دادههای آموزشی این مدلها منتشر نشدهاند و در نتیجه، با تعریف رسمی «متنباز» همخوانی ندارند.
در دسترس نیست؛ اروپا باز هم جا ماند
مدلهای Llama 4 فعلاً برای کاربران اروپایی، اعم از پژوهشی و شخصی، غیرقابل دسترسی هستند. متا توضیحی رسمی در اینباره ارائه نکرده، اما در گذشته نیز عرضه نسخههای پیشین Llama در اتحادیه اروپا به دلیل ملاحظات مقرراتی و حریم خصوصی کاربران متوقف شده بود. کاربران خارج از اروپا میتوانند این مدلها را از طریق پلتفرمهای Meta یا Hugging Face دانلود کنند.
کاهش سوگیری سیاسی؛ حرکت به سمت شمولگرایی بیشتر
متا اعلام کرده که تمامی مدلهای Llama 4 در زمینه کاهش سوگیری سیاسی نسبت به مدلهای قبلی بهبود یافتهاند. این شرکت اشاره کرده که بسیاری از مدلهای معروف پیشین، گرایشهایی به چپ سیاسی داشتند، اما اکنون Llama 4 به شکلی طراحی شده که دیدگاههای راستگرایانه نیز بازنمایی بهتری در آن دارند. این رویکرد جدید، در ادامه نزدیکی اخیر زاکربرگ با دونالد ترامپ پس از پیروزی او در انتخابات ۲۰۲۴ آمریکا تفسیر شده است.
۲۲۷۲۲۷
نظر شما