۱ نفر

۱۷ فروردین ۱۴۰۴ - ۱۵:۴۰

چین در برابر آمریکا: دیپ‌سیک با مدل جدید به میدان آمد؟

شرکت دیپ‌سیک از روش جدید استدلال هوش مصنوعی رونمایی کرد و انتظارات برای مدل نسل بعدی این شرکت افزایش یافت.

نگار علی- شرکت نوپای چینی دیپ‌سیک (DeepSeek) که در زمینه هوش مصنوعی فعالیت می‌کند، رویکرد نوینی را برای بهبود توانایی‌های استدلالی مدل‌های زبانی بزرگ (LLMs) معرفی کرده است. این در حالی است که مردم با اشتیاق منتظر انتشار مدل نسل بعدی این شرکت هستند. دیپ‌سیک با همکاری محققان دانشگاه تسینگهوا، تکنیکی را توسعه داده که ترکیبی از روش‌های مدل‌سازی پاداش مولد (GRM) و تنظیم نقد خوداصل‌محور است.

*«نقد خوداصل‌محور» یکی از روش‌هایی است که شرکت دیپ‌سیک در همکاری با دانشگاه تسینگهوا برای بهبود عملکرد مدل‌های زبانی بزرگ (LLMs) توسعه داده است. این تکنیک بخشی از رویکرد دوگانه‌ای است که با مدل‌سازی پاداش مولد (GRM) ترکیب شده تا مدل‌ها بتوانند پاسخ‌های دقیق‌تر و سریع‌تری به پرس‌وجوهای عمومی ارائه دهند. در این روش، مدل به‌گونه‌ای تنظیم می‌شود که بر اساس اصول درونی خود، خروجی‌هایش را ارزیابی و اصلاح کند. به عبارت دیگر، این فرآیند به مدل اجازه می‌دهد تا به‌صورت خودکار نقاط ضعف یا خطاهای احتمالی در استدلال خود را شناسایی کرده و آن‌ها را بهبود ببخشد، بدون اینکه صرفاً به بازخورد خارجی وابسته باشد. این رویکرد به هدایت مدل به سمت ترجیحات انسانی و افزایش کارایی آن کمک می‌کند.

این روش دوگانه، که جزئیات آن در مقاله‌ای روز جمعه منتشر شد، با هدف ارائه پاسخ‌های بهتر و سریع‌تر به پرس‌وجوهای عمومی توسط مدل‌های زبانی بزرگ طراحی شده است.

بر اساس گزارش محققان، مدل‌های DeepSeek-GRM که از این روش بهره می‌برند، عملکرد بهتری نسبت به روش‌های موجود نشان داده‌اند و به سطح رقابتی با مدل‌های پاداش عمومی قدرتمند دست یافته‌اند. مدل‌سازی پاداش فرایندی است که مدل‌های زبانی را به سمت ترجیحات انسانی هدایت می‌کند. دیپ‌سیک قصد دارد این مدل‌های GRM را به‌صورت متن‌باز در دسترس عموم قرار دهد، هرچند هنوز جدول زمانی مشخصی برای این کار اعلام نشده است.

این مقاله علمی که در بخش آنلاین مقالات علمی arXiv منتشر شده، در حالی ارائه می‌شود که گمانه‌زنی‌ها درباره گام بعدی این شرکت نوپا پس از جلب توجه جهانی با مدل پایه V3 و مدل استدلالی R1 بالا گرفته است. بنا بر گزارش رویترز در ماه گذشته، مدل DeepSeek-R2، که جانشین R1 محسوب می‌شود، ممکن است همین ماه منتشر شود. دیپ‌سیک با عجله در تلاش است تا از افزایش شهرت خود بهره‌برداری کند. انتشار DeepSeek-R1 با عملکرد مقرون‌به‌صرفه‌اش که با مدل‌های پیشرو رقابت می‌کرد، جامعه فناوری جهانی را تحت تأثیر قرار داد.

با این حال، دیپ‌سیک درباره شایعات مربوط به انتشار R2 سکوت اختیار کرده و از طریق کانال‌های رسمی عمومی اظهارنظری نکرده است. البته ماه گذشته، یک حساب خدمات مشتریان این شرکت در چت گروهی با مشتریان تجاری، این گزارش را تکذیب کرد؛ خبری که رسانه‌های چینی آن را منتشر کردند. دیپ‌سیک هنوز به درخواست اظهارنظر در روز جمعه پاسخی نداده است.

دیپ‌سیک که در شهر هانگژو مستقر است و در سال ۲۰۲۳ توسط کارآفرین لیانگ ون‌فنگ تأسیس شده، در چند ماه اخیر در مرکز توجه جهانی قرار گرفته، اما این شرکت ترجیح داده به‌جای ارتباط عمومی، تمرکز خود را بر تحقیق و توسعه بگذارد.

منبع: scmp

۲۲۷۲۲۷

کد خبر 2046081

چین در برابر آمریکا: دیپ‌سیک با مدل جدید به میدان آمد؟

برچسب‌ها

خدمات گردشگری

نظر شما

آخرین اخبار

هشدار دیپ‌مایند گوگل: هوش جامع مصنوعی می‌تواند بشریت را برای همیشه نابود کند

آخرین اخبار هوش مصنوعی

هشدار دیپ‌مایند گوگل: هوش جامع مصنوعی می‌تواند بشریت را برای همیشه نابود کند

این مدل هوش مصنوعی انحراف اخلاقی دارد!

شغل‌هایی که توسط هوش مصنوعی از بین می‌روند!

برای اولین‌ بار در جهان، امارات از هوش مصنوعی برای نوشتن قوانین استفاده می‌کند

عینک هوشمند اپل با هوش مصنوعی از راه می‌رسد

هم‌بنیان‌گذار لینکدین هر روز با این ابزار هوش مصنوعی کار می‌کند تا دید بهتری نسبت به آینده داشته باشد

ترامپ علیه اروپا: نبرد بزرگ بر سر قوانین هوش مصنوعی

هوش مصنوعی سرطان را ریشه‌کن خواهد کرد؟

کدام مشاغل اولین قربانیان هوش مصنوعی خواهند بود؟

ویکتور لازارته: هوش مصنوعی همین حالا جای انسان‌ها را گرفته است

هوش مصنوعی روی تشک کشتی / تیلور با کمک کامپیوتر یزدانی را شکست داد؟

برگزاری اولین نمایشگاه بین‌المللی هوش مصنوعی و صنایع وابسته در تهران

ابزار جستجوی عمیق «ChatGPT» رایگان شد

کلاهبرداری مدرن زیر سایه AI: هوش مصنوعی، کابوس جدید شرکت‌ها شد!

پایگاه فکر و فرهنگ مبلغ

دروغگویی و توریه چیست؟

مسجدی انقلابی در مجاورت با ساختمان ساواک!

ببینید | اربعین موسوی؛ ایامی که خداوند تورات را بر موسی نازل کرد

نظر آیت الله جوادی آملی درباره تخریب مسجد

آسیب صدور فتوا بدون توجه به پیامدهای اجتماعی آن

چرا دخترم حرف‌هایم را نمی‌شنود؟ / راهکارهای تربیت بدون دردسر

جزء ۲۹ قرآن؛ قیامت چقدر سخت است؟

۴۰ روزی که می‌تواند زندگی ما را تغییر دهد

کافه خبر در یوتیوب

در بحث مشارکت کنید

ترامپ: بدون اینکه مجبور به بمباران شوم،خیلی زود با ایران به توافق می‌رسیم/بروید سراغ اوباما؛این جنگ بایدن است، نه جنگ ترامپ!

ایستاده به تماشای قتل؛مردم مقصرند؟/ زن‌کشی نه تنها تبعاتی ندارد بلکه در ذیل اختلاف‌خانوادگی تعریف می‌شود/معاون زنان آقای پزشکیان این قتل را محکوم کرد؟