راه اندازی هوش مصنوعی LLaMA توسط متا

۲۳ اسفند ۱۴۰۱ | ۰۹:۲۱ کد : ۲۱۰۷۲ اخبار روز
تعداد بازدید:۱۲۲۳
راه اندازی  هوش مصنوعی LLaMA  توسط متا

رونمایی هوش مصنوعی LLaMA  توسط متا: متا مدل LLaMA را راه اندازی کرد، ابزاری تحقیقاتی قوی تر از  GPT-3 OpenAI این غول رسانه های اجتماعی قصد دارد این فناوری را در دسترس محققان قرار دهد و در آینده آن را در محصول خود ادغام کند.

LLaMA یک ربات چت نیست، بلکه یک ابزار تحقیقاتی است که می تواند به حل مسائل مربوط به مدل های زبان هوش مصنوعی کمک کند.

پس از انقلابی که ChatGPT OpenAI به وجود آورد ، گوگل BARD خود را رونمایی کرد و چندین نفر دیگر نیز از آن پیروی کردند. اکنون به نظر می رسد که  Meta Platforms، Inc در حال آماده شدن برای برتری نسبت به همتایان خود است. مارک زاکربرگ غول فناوری مستقر در کالیفرنیا ابزار تحقیقاتی جدیدی را معرفی کرده است که به زودی به ساخت چت ربات های مبتنی بر هوش مصنوعی کمک می کند.

این شرکت به صورت عمومی مدل متا AI مدل زبان بزرگ (LLaMA) خود را منتشر کرده است. طبق انتشار رسمی، LLaMA (لالاما) یک مدل زبان پایه پیشرفته است که برای کمک به محققان در کار خود در زیر شاخه هوش مصنوعی توسعه یافته است. جالب اینجاست که این سومین LLM متا پس از Glactica و Blender Bot 3 است که بلافاصله پس از نتایج نادرست تعطیل شدند.

آیا LLaMA لالاما می تواند رقیب ChatGPT چت جی پی تی باشد؟

LLaMA  چیست؟

LLaMA  اساسا یک ربات چت نیست. این یک ابزار تحقیقاتی است که به گفته متا، احتمالاً مشکلات مربوط به مدل‌های زبان هوش مصنوعی را حل خواهد کرد. متا در وبلاگ رسمی خود گفت: «مدل‌های کوچکتر و کارآمدتر مانند LLaMA دیگران را در جامعه تحقیقاتی که به مقادیر زیادی زیرساخت دسترسی ندارند، قادر می‌سازد تا این مدل‌ها را مطالعه کنند و دسترسی بیشتر به این زمینه مهم و در حال تغییر را بیشتر کند.» .

LLaMA  مجموعه ای از مدل های زبان است که از پارامترهای ۷B  تا ۶۵B  متغیر است. این شرکت گفته است که مدل‌های خود را با تریلیون‌ها توکن آموزش می‌دهد و ادعا می‌کند که آموزش مدل‌های پیشرفته با استفاده از مجموعه داده‌های عمومی امکان‌پذیر است و بر مجموعه داده‌های اختصاصی و غیرقابل دسترسی تکیه نمی‌کند.

LLaMA  چگونه متفاوت است؟

به گفته متا، آموزش مدل‌های بنیادی کوچک‌تر مانند LLaMA ایده‌آل است زیرا به قدرت محاسباتی و منابع بسیار پایینی برای آزمایش، اعتبارسنجی و کشف موارد استفاده جدید نیاز دارند. مدل‌های زبان بنیادی برای آموزش بر روی تکه‌های بزرگی از داده‌ها بدون برچسب شناخته شده‌اند و این باعث می‌شود آنها برای سفارشی‌سازی بر اساس وظایف مختلف ایده‌آل باشند. متا گفته است که LLaMA را در اندازه هایی مانند پارامترهای ۷B، ۱۳B، ۳۳B و ۶۵B  ارائه خواهد کرد.

متا در مقاله تحقیقاتی خود اشاره کرد که LLaMA-13B در بیشتر معیارها از GPT-3 (175B) OpenAI بهتر عمل کرد و LLaMA-65B با بهترین مدل‌ها،  Chinchilla70B DeepMind  و PaLM-540B Google  رقابت می‌کند. پس از آموزش کامل، LLaMA-13B  می‌تواند برای کسب‌وکارهای کوچکی که مشتاق اجرای آزمایش‌ها بر روی این سیستم‌ها هستند، یک موهبت باشد، با این حال، ممکن است هنوز از پژوهشگرانی که در انزوا کار می‌کنند دور باشد.

LLaMA  در حال حاضر در هیچ یک از محصولات متا استفاده نمی شود، با این حال، این شرکت برنامه هایی برای در دسترس قرار دادن آن در اختیار محققان دارد. این شرکت قبلا LLM OPT-175B خود را راه اندازی کرده بود اما LLaMA سیستم پیشرفته تر آن است. متا همچنین کد منبع مدل LLaMA را در دسترس افراد خارجی قرار داده است تا نحوه عملکرد سیستم را ببینند.این به آنها امکان سفارشی سازی و همکاری در پروژه های مرتبط را می دهد.

 

رمزگشایی مدل های زبان بزرگ

مدل‌های زبان بزرگ یا LLM سیستم‌های هوش مصنوعی هستند که حجم عظیمی از متن دیجیتالی را از منابع اینترنتی مانند مقاله‌ها، گزارش‌های خبری و پست‌های رسانه‌های اجتماعی مصرف می‌کنند. از این متون دیجیتالی برای آموزش نرم افزاری استفاده می شود که بر اساس درخواست ها و پرس و جوها، محتوا را از ابتدا پیش بینی و تولید می کند. این مدل‌ها می‌توانند در کارهایی مانند نوشتن مقاله، نوشتن پست‌های رسانه‌های اجتماعی، پیشنهاد کد برنامه‌نویسی و ایجاد مکالمات ربات چت کمک کنند.

آخرین نسخه از متا در زمانی منتشر شد که این شرکت تا حد زیادی از صحبت‌های پیرامون چت ربات‌های هوش مصنوعی انقلابی غایب بود. متا یکی از اولین کسانی بود که چت بات های خود را منتشر کرد. با این حال، به دلیل نتایج نادرست و پاسخ کم، برنامه های آن به اشتباه افتاد.با LLaMa ، متا به نظر می رسد خود را به بازی بازگردانده است.


( ۷ )

نظر شما :