۲ نفر

۲۶ اردیبهشت ۱۴۰۳ - ۱۷:۲۸

همه‌چیز در مورد هوش مصنوعی گوگل: از چت‌بات‌ سفارشی تا عینک هوشمند

بخش زیادی از کنفرانس گوگل I/O 2024 به قابلیت‌های هوش مصنوعی Gemini و سایر محصولات این شرکت اختصاص داشت. مدل هوش مصنوعی جمینای 1.5 فلش، Project Astra، هوش مصنوعی «Veo» برای ساخت ویدیو و امکان ساخت چت‌بات‌های سفارشی از جمله اطلاعیه‌های جدید گوگل در این رویداد بودند.

به گزارش خبرگزاری خبرآنلاین، شرکت گوگل کنفرانس سالانه توسعه‌دهندگان خود را موسوم به I/O با معرفی هوش مصنوعی جدید خود، Gemini 1.5 Flash AI آغاز کرد که گفته می‌شود سبک‌تر از مدل Gemini Pro و در دسترس‌تر است.

Gemini 1.5؛ سریع‌تر و ارزان‌تر

مدل Gemini 1.5 Flash به‌گونه‌ای طراحی شده است که سرعت بالاتر و تأخیر کمتری داشته باشد. مدیرعامل دیپ‌مایند می‌گوید که گوگل مدل Gemini 1.5 Flash را به آن دلیل ساخته که توسعه‌دهندگان به مدل سبک‌تر و ارزان‌تری از نسخه پرو نیاز داشتند. نسخه فلش در جایگاهی میان جمینای 1.5 پرو و جمینای 1.5 نانو قرار می‌گیرد.

جمینای 1.5 فلش البته برای مصرف‌کنندگان معمولی ساخته نشده است. این مدل هوش مصنوعی توسعه‌دهندگانی را هدف قرار داده است که می‌خواهند محصولات و سرویس‌های مبتنی بر هوش مصنوعی بسازند.

موتورجست‌وجوی گوگل با هوش مصنوعی Gemini متحول می‌شود

هوش مصنوعی Gemini گوگل در جدیدترین رویداد این شرکت با تحولات قابل‌توجهی در زمینه جست‌وجوی هوشمند مواجه شده است. این تحولات می‌توانند یکی از مهم‌ترین نقاط قوت هوش مصنوعی گوگل طی چند وقت اخیر باشند.

گوگل جمینای حالا به بخشی از گوشی‌های اندرویدی تبدیل شده و با نصب اپ اختصاصی آن، می‌توانید به‌صورت یکپارچه از این هوش مصنوعی استفاده کنید. گوگل با هماهنگ‌سازی اپ جمینای و سیستم‌عامل اندروید، به کاربر اجازه می‌دهد تا به‌سادگی بخش‌های مختلف گوشی هوشمند خود را جست‌وجو و اطلاعات مورد نظر خود را پیدا کند.

یکی از ویژگی‌های جذابی که گوگل برای اپلیکیشن Gemini معرفی کرد، قابلیت Live یا «زنده» است. در کنفرانس توسعه‌دهندگان گوگل اعلام شد که Gemini Live می‌تواند قابلیت گفت‌وگوی طبیعی با این مدل هوش مصنوعی را فراهم کند تا تعامل صوتی بهتری با این فناوری داشته باشید.

قابلیت Gemini Live از طریق آیکون صدا در اپلیکیشن Gemini در اندروید و iOS در دسترس خواهد بود. زمانی که روی این آیکون بزنید، با پنجره‌ای تمام‌صفحه روبه‌رو می‌شوید که افکت موجی جذابی را هم به شما نشان می‌دهد. در این حالت می‌توانید با هوش مصنوعی دیالوگ دوطرفه داشته باشید و پاسخ سؤالات خود را در کمترین زمان بگیرید.

چت‌بات‌های سفارشی خود را تولید کنید

گوگل از چندین ویژگی جدید برای هوش مصنوعی Gemini خود رونمایی کرد که یکی از قدرتمندترین آن‌ها قابلیتی به نام «Gems» است که به کاربران اجازه می‌دهد نسخه‌های سفارشی دستیار Gemini خود را با شخصیت‌های مختلف ایجاد کنند.

قابلیت Gems به شما اجازه می‌دهد تا چت‌بات‌های گفتگومحور خود را ایجاد کنید که می‌توانند وظایف خاصی را انجام دهند. همچنین چت‌بات‌های هوش مصنوعی که با این قابلیت ساخته می‌شوند، می‌توانند دارای ویژگی‌های شخصیتی منحصر به فرد خود باشند.

قابلیت‌های هوش مصنوعی جدید اندروید

گوگل اعلام کرد که قابلیت جست‌وجوی مبتنی بر هوش مصنوعی به گوشی‌های هوشمند اندرویدی اضافه خواهد شد و Gemini دستیار جدید هوش مصنوعی کاربران می‌شود تا وظایف مختلفی را انجام دهد. پردازش روی دستگاه هوش مصنوعی نیز در راه است. گوگل توضیحات خود را با قابلیت Circle to Search آغاز کرد که به گفته آن، اکنون دستیار آموزشی همه‌جانبه‌ای برای دانش‌آموزان است.

گوگل می‌گوید که این قابلیت در دستگاه‌های اندرویدی به‌زودی می‌تواند مسائل بسیار پیچیده و چندبعدی را درک و حل کند. همچنین تا پایان سال ۲۰۲۴، بیش از ۲۰۰ میلیون دستگاه به آن مجهز خواهند شد.

قدرتمندترین AI تصویرساز گوگل

مدل هوش مصنوعی Imagen 3، مولد تصویری است که به‌ادعای اهالی مانتین‌ویو، قدرتمندترین هوش مصنوعی تصویرساز این برند محسوب می‌شود. ظاهراً گوگل آماده شده تا بیش‌از پیش در زمینه تولید تصاویر با پرامپت قدرت‌نمایی کند.

گوگل این مولد تصویر هوش مصنوعی را به‌زودی در دسترس توسعه‌دهندگان و مشتریان سازمانی قرار خواهد داد. ظاهراً این شرکت در نظر دارد که در فاز بعدی، هوش مصنوعی Imagen 3 را برای عموم افراد نیز منتشر کند.

هوش مصنوعی «Veo»؛ ساخت ویدیوهای خیره‌کننده با دستورات متنی

هوش مصنوعی ویدیوساز پیشرفته «Veo»، می‌تواند ویدیوهای فول اچ‌دی را بر اساس پرامپت متنی بسازد یا پس از ساخت ویدیو، با دستورات متنی آن‌ها را تغییر دهد. این هوش مصنوعی پیشرفته دراصل پاسخ این شرکت به هوش مصنوعی Sora از OpenAI است.

گوگل ادعا می‌کند که Veo درکی پیشرفته از زبان و مفاهیم بصری دارد تا بتواند هر ویدیویی را که کاربر در ذهن خود دارد، ایجاد کند. ویدئوهای تولیدشده با این هوش مصنوعی، تکنیک‌های سینمایی و بصری مانند مفهوم تایم‌لپس را به‌نمایش می‌گذارند.

هوش مصنوعی ویدیوساز Veo در بخش VideoFX گوگل برای برخی از سازندگان در دسترس خواهد بود و این شرکت می‌گوید که به YouTube Shorts و سایر محصولات نیز می‌آید. اگر Veo درنهایت به این بخش از یوتیوب اضافه شود، این ویژگی می‌تواند برتری‌هایی برای یوتیوب ایجاد کند.

پاسخ مستقیم گوگل به قابلیت‌های جدید ChatGPT

در این کنفرانس همچنین از Astra به‌عنوان «هوش مصنوعی جهانی» یاد شد که «می‌تواند در زندگی روزمره مفید باشد.» به‌نظر می‌رسد که پروژه جدید گوگل پاسخ مستقیمی به قابلیت‌های جدید ChatGPT است که یک روز قبل از رویداد گوگل، توسط OpenAI معرفی شده بود.

ظاهراً Project Astra اپلیکیشنی است که به دوربین دستگاه دسترسی دارد و از طریق آن می‌تواند به برخی سوالات توضیح دهد. در این ویدیو، Astra از طریق دوربین می‌تواند به محیط اطراف کاربر نگاه کند و آن را توصیف کند. نکته‌ای که در کنفرانس گوگل موردتوجه خبرنگاران و افراد حاضر قرار گرفت، سرعت عمل Astra در ارائه پاسخ‌ها است. به گفته گوگل، Astra نه تنها داده‌های بصری را در زمان واقعی پردازش می‌کند، بلکه هرچیزی را که می‌بیند، می‌تواند به خاطر بیاورد و از اطلاعات ذخیره‌شده خود نیز استفاده می‌کند.

ویژگی «AI Overviews» و قابلیت‌های آن

گوگل درجریان رویداد Google I/O 24 از ویژگی «AI Overviews» نیز برای موتور جست‌وجوی خود رونمایی کرد. این ویژگی در تجربه جست‌وجوی کاربران، تغییراتی اساسی ایجاد می‌کند.

گوگل سال گذشته از ویژگی هوش مصنوعی جدیدی برای تجربه SGE مرورگر کروم رونمایی کرد که کاربران با کمک آن می‌توانند مقالات موجود در وب را خلاصه کنند. باتوجه به اسکرین‌شات‌هایی که در رویداد به‌نمایش گذاشته شد، به‌نظر می‌رسد ویژگی AI Overviews می‌تواند به‌شکل موثری همان «SGE» با نامی جدید باشد.

Ask Photos؛ ویژگی جدید هوش مصنوعی

گوگل همچنین درجریان این رویداد از ویژگی جدیدی برای گوگل فوتوز رونمایی کرد. این ویژگی به صورت آزمایشی در دسترس کاربران قرار دارد و با هوش مصنوعی جمینای گوگل پشتیبانی می‌شود. این ویژگی اواخر تابستان عرضه خواهد شد.

نسل ششم پردازنده تنسور با نام Trillium

غول فناوری مستقر در ماونتین ویو یکی از معدود شرکت‌هایی است که پردازنده‌های خود را به‌عنوان جایگزین پردازنده‌های انویدیا ارائه می‌کند. پردازنده جدید Trillium نیز ساخته شده که توان لازم را برای تولید متن و دیگر فایل‌های رسانه‌ای از مدل‌های بزرگ هوش مصنوعی فراهم کند. این پردازنده نه‌تنها حدود ۵ برابر قوی‌تر از پردازنده نسل قبلی یعنی v5e است، بلکه ۶۷ درصد در مصرف انرژی بهینه‌تر عمل می‌کند. سوندار پیچای می‌گوید پردازنده تنسور جدید آن‌ها بهینه‌ترین TPU تاریخ گوگل است.

مهندسان گوگل در طراحی این واحد پردازشی تنسور با افزایش ظرفیت حافظه‌ای که پهنای باند بالا دارد، توانایی این پردازنده را ارتقا داده‌اند. مدل‌های هوش مصنوعی معمولاً به مقدار زیادی حافظه نیاز دارند که می‌توانند گلوگاه عملکرد این سیستم‌ها باشند. گوگل همچنین واحدهای MXU را در این پردازنده گسترش داده و مجموع سرعت کلاک را بالا برده است.

پردازنده Trillium از نسل سوم SparseCore استفاده می‌کند که گوگل آن را به‌عنوان شتاب‌دهنده‌ای تخصصی برای رتبه‌بندی‌های پیشرفته و کارهای مربوط به توصیه محتوا توصیف می‌کند. این شرکت می‌گوید با این کار، Trillium می‌تواند مدل‌ها را سریع‌تر آموزش بدهد و تأخیر کمتری داشته باشد.

LearnLM؛ یادگیری بهتر با هوش مصنوعی

یکی از مدل‌های هوش مصنوعی معرفی شده گوگل، LearnLM نام دارد که بر مبنای مدل جمینای ساخته شده و برای یادگیری بهینه‌سازی شده است. گوگل درحال همکاری با معلمان است تا این مدل‌ها را وارد کلاس‌های درس کند. این شرکت اعتقاد دارد که این هوش مصنوعی می‌تواند در یادگیری و برنامه‌ریزی‌های درسی کاربردهای زیادی داشته باشد.

گوگل در این باره اعلام کرده است که با متخصصانی از کالج معلمان کلمبیا، دانشگاه ایالتی آریزونا، دانشگاه نیویورک تیش و خان آکادمی نیز همکاری خواهد کرد تا این فناوری را آزمایش کند و بهبود ببخشد.

مدل زبانی با ۲۷ میلیارد پارامتر!

گوگل در کنفرانس سالانه توسعه‌دهندگان Google I/O 2024 از نسل بعدی مدل‌های زبانی Gemma رونمایی کرد. نسخه متن‌باز Gemma 2 با ۲۷ میلیارد پارامتر در ماه ژوئن عرضه می‌شود.

در حال حاضر PaliGemma، یک نوع Gemma از پیش‌آموزش‌دیده است که گوگل آن را به‌عنوان «نخستین مدل زبان بینایی در خانواده Gemma» برای شرح تصاویر، برچسب‌گذاری تصویر و موارد استفاده بصری پرسش و پاسخ توصیف می‌کند.

ظاهرا گوگل این مدل ۲۷ میلیارد پارامتری را برای اجرا روی پردازنده‌های گرافیکی نسل بعدی انویدیا، میزبان Google Cloud TPU و سرویس مدیریت‌شده Vertex AI بهینه کرده است.

گوگل در حاشیه این کنفرانس اعلام کرد که امروز (چهارشنبه، ۲۶ اردیبهشت) دومین نسخه بتا از سیستم عامل اندروید 15 منتشر می‌شود.

گوگل هنوز به‌طور دقیق مشخص نکرده که این آپدیت جدید شامل چه ویژگی‌هایی می‌شود، اما شاید برخی قابلیت‌های هوش مصنوعی جدید نیز در آن مورد آزمایش قرار بگیرند. احتمالاً طی چند روز آینده، گزارش‌های بیشتری در این رابطه منتشر خواهد شد.

گزینه جدید Web در نوار جستجوی گوگل

گفته می‌شود که گزینه Web تقریباً تمام بلوک‌های محتوایی را که گوگل در صفحه نتایج جست‌وجو قرار می‌دهد، فیلتر می‌کند و تنها لینک‌ها و متن‌ ساده وب‌سایت‌ها را خواهید داشت. همچنین گزینه Web قابلیت جدید جست‌وجوی هوش مصنوعی این شرکت را نیز مسدود خواهد کرد. این قابلیت هنوز برای تمامی کاربران فعال نیست و به‌مرور در دسترس قرار خواهد گرفت.

البته این گزینه جدید، شاید برای برخی کاربران چندان کاربردی نباشد. چون که بلوک و ماژول‌های پیشنهادی گوگل در بالای صفحه معمولا مفید واقع می‌شود. همچنین بعید است که غول فناوری تنها با فشردن دکمه Web از تبلیغات خود دست بکشد. به‌هرحال در مواقعی که به‌دنبال پاسخ ساده و مشخصی هستید، ماژول‌های گوگل می‌توانند به سرعت چنین پاسخی را برای شما فراهم کنند و نیازی به گزینه Web نخواهید داشت.

گوگل در مراسم I/O ظاهراً عینک هوشمند جدید خود را هم نشان داد

به نظر می‌رسد که گوگل در خلال مراسم I/O خود، نمونه اولیه عینک هوشمند آینده‌اش را نیز برای چند لحظه نشان داده باشد. این پروژه‌ ممکن است با کمک سامسونگ و شاید حتی کوالکام ساخته شود.

هنوز مشخص نیست که آیا گوگل واقعاً چنین عینکی را عرضه خواهد کرد یا خیر، اما احتمال دارد گوگل قصد داشته باشد عینک‌ هوشمندی با نمایشگرهای AR ارائه دهد. همچنین در توضیحات یوتوب ویدیوی Project Astra، گوگل می‌گوید که دومین قسمت از دموی این پروژه روی «نمونه اولیه یک عینک» اجرا می‌شود.

البته گوگل سابقه‌ای نسبتاً طولانی در ساخت عینک‌های AR دارد. «گوگل گلس» این شرکت با شیشه‌های کوچک چند سال پیش رونمایی شد، اما چندان مورد پسند کارشناسان و کاربران قرار نگرفت. بااین‌حال، اکنون با روی‌کارآمدن هوش مصنوعی مولد، مخصوصاً با قابلیت‌های صوتی و بصری آن، شاید بتوان گفت که با این فناوری جدید، در آینده گوگل گلس احیا خواهد شد.

۵۴۳۲۳

کد خبر 1906989