راه اندازی هوش مصنوعی LLaMA توسط متا
رونمایی هوش مصنوعی LLaMA توسط متا: متا مدل LLaMA را راه اندازی کرد، ابزاری تحقیقاتی قوی تر از GPT-3 OpenAI این غول رسانه های اجتماعی قصد دارد این فناوری را در دسترس محققان قرار دهد و در آینده آن را در محصول خود ادغام کند.
LLaMA یک ربات چت نیست، بلکه یک ابزار تحقیقاتی است که می تواند به حل مسائل مربوط به مدل های زبان هوش مصنوعی کمک کند.
پس از انقلابی که ChatGPT OpenAI به وجود آورد ، گوگل BARD خود را رونمایی کرد و چندین نفر دیگر نیز از آن پیروی کردند. اکنون به نظر می رسد که Meta Platforms، Inc در حال آماده شدن برای برتری نسبت به همتایان خود است. مارک زاکربرگ غول فناوری مستقر در کالیفرنیا ابزار تحقیقاتی جدیدی را معرفی کرده است که به زودی به ساخت چت ربات های مبتنی بر هوش مصنوعی کمک می کند.
این شرکت به صورت عمومی مدل متا AI مدل زبان بزرگ (LLaMA) خود را منتشر کرده است. طبق انتشار رسمی، LLaMA (لالاما) یک مدل زبان پایه پیشرفته است که برای کمک به محققان در کار خود در زیر شاخه هوش مصنوعی توسعه یافته است. جالب اینجاست که این سومین LLM متا پس از Glactica و Blender Bot 3 است که بلافاصله پس از نتایج نادرست تعطیل شدند.
آیا LLaMA لالاما می تواند رقیب ChatGPT چت جی پی تی باشد؟
LLaMA چیست؟
LLaMA اساسا یک ربات چت نیست. این یک ابزار تحقیقاتی است که به گفته متا، احتمالاً مشکلات مربوط به مدلهای زبان هوش مصنوعی را حل خواهد کرد. متا در وبلاگ رسمی خود گفت: «مدلهای کوچکتر و کارآمدتر مانند LLaMA دیگران را در جامعه تحقیقاتی که به مقادیر زیادی زیرساخت دسترسی ندارند، قادر میسازد تا این مدلها را مطالعه کنند و دسترسی بیشتر به این زمینه مهم و در حال تغییر را بیشتر کند.» .
LLaMA مجموعه ای از مدل های زبان است که از پارامترهای ۷B تا ۶۵B متغیر است. این شرکت گفته است که مدلهای خود را با تریلیونها توکن آموزش میدهد و ادعا میکند که آموزش مدلهای پیشرفته با استفاده از مجموعه دادههای عمومی امکانپذیر است و بر مجموعه دادههای اختصاصی و غیرقابل دسترسی تکیه نمیکند.
LLaMA چگونه متفاوت است؟
به گفته متا، آموزش مدلهای بنیادی کوچکتر مانند LLaMA ایدهآل است زیرا به قدرت محاسباتی و منابع بسیار پایینی برای آزمایش، اعتبارسنجی و کشف موارد استفاده جدید نیاز دارند. مدلهای زبان بنیادی برای آموزش بر روی تکههای بزرگی از دادهها بدون برچسب شناخته شدهاند و این باعث میشود آنها برای سفارشیسازی بر اساس وظایف مختلف ایدهآل باشند. متا گفته است که LLaMA را در اندازه هایی مانند پارامترهای ۷B، ۱۳B، ۳۳B و ۶۵B ارائه خواهد کرد.
متا در مقاله تحقیقاتی خود اشاره کرد که LLaMA-13B در بیشتر معیارها از GPT-3 (175B) OpenAI بهتر عمل کرد و LLaMA-65B با بهترین مدلها، Chinchilla70B DeepMind و PaLM-540B Google رقابت میکند. پس از آموزش کامل، LLaMA-13B میتواند برای کسبوکارهای کوچکی که مشتاق اجرای آزمایشها بر روی این سیستمها هستند، یک موهبت باشد، با این حال، ممکن است هنوز از پژوهشگرانی که در انزوا کار میکنند دور باشد.
LLaMA در حال حاضر در هیچ یک از محصولات متا استفاده نمی شود، با این حال، این شرکت برنامه هایی برای در دسترس قرار دادن آن در اختیار محققان دارد. این شرکت قبلا LLM OPT-175B خود را راه اندازی کرده بود اما LLaMA سیستم پیشرفته تر آن است. متا همچنین کد منبع مدل LLaMA را در دسترس افراد خارجی قرار داده است تا نحوه عملکرد سیستم را ببینند.این به آنها امکان سفارشی سازی و همکاری در پروژه های مرتبط را می دهد.
رمزگشایی مدل های زبان بزرگ
مدلهای زبان بزرگ یا LLM سیستمهای هوش مصنوعی هستند که حجم عظیمی از متن دیجیتالی را از منابع اینترنتی مانند مقالهها، گزارشهای خبری و پستهای رسانههای اجتماعی مصرف میکنند. از این متون دیجیتالی برای آموزش نرم افزاری استفاده می شود که بر اساس درخواست ها و پرس و جوها، محتوا را از ابتدا پیش بینی و تولید می کند. این مدلها میتوانند در کارهایی مانند نوشتن مقاله، نوشتن پستهای رسانههای اجتماعی، پیشنهاد کد برنامهنویسی و ایجاد مکالمات ربات چت کمک کنند.
آخرین نسخه از متا در زمانی منتشر شد که این شرکت تا حد زیادی از صحبتهای پیرامون چت رباتهای هوش مصنوعی انقلابی غایب بود. متا یکی از اولین کسانی بود که چت بات های خود را منتشر کرد. با این حال، به دلیل نتایج نادرست و پاسخ کم، برنامه های آن به اشتباه افتاد.با LLaMa ، متا به نظر می رسد خود را به بازی بازگردانده است.
نظر شما :