استفاده از هوش مصنوعی برای شناسایی مواد مشابه در تصویر

۱۶ خرداد ۱۴۰۲ | ۰۶:۲۸ کد : ۲۱۹۸۹ اخبار روز
تعداد بازدید:۱۱۵
استفاده از هوش مصنوعی برای شناسایی مواد مشابه در تصویر

این روش یادگیری ماشینی می‌تواند به درک صحنه‌های رُباتیک، ویرایش تصویر و سامانه‌های پیشنهاد آنلاین، کمک کند تا فضای مورد مشاهده را بهتر درک کنند.

برای نمونه اگر رباتی در یک آشپزخانه کار کند، او نیاز خواهد داشت تا برای کار از اشیاء گوناگون استفاده کند و به همین خاطر نیز از درک اینکه چه نمونه‌هایی از مواد همانند تشکیل‌شده‌اند، سود می‌برد. با این توانایی، ربات می‌داند فرق چگونه برداشتن یک تکه کره کوچک از گوشه سایه‌دار پیشخوان با یک قالب کره بزرگ از داخل یخچال با نور مصنوعی، چیست و چگونه باید کار کند.

شناسایی اشیائی که از مواد یکسانی تشکیل‌شده‌اند و گزینش مواد شناخته‌شده از میان آن‌ها در صحنه‌های یکسان یا گوناگون، یک مشکل چالش‌برانگیز برای ماشین‌ها است؛ چراکه ظاهر یک ماده می‌تواند به‌شدت بر پایه ریخت جسم یا شرایط نور دگرگون باشد.

حال دانشمندان MIT و Adobe Research گامی در سوی حل این چالش برداشته‌اند. آنها تکنیکی را پیشرفت دادند که می‌تواند، تمام پیکسل‌های یک تصویر را که نشان‌دهنده یک ماده معین است، شناسایی کند؛ درنهایت این پیکسل‌ها در پیکسل انتخاب‌شده توسط کاربر نشان داده می‌شوند.

این روش چنان دقیق است که حتی زمانی که اشیاء «اشکال و اندازه‌های» متفاوتی دارند و مواد مشابه را متفاوت به نظر می‌رسانند، فریب سایه‌ها، شرایط نوری یا حتی پرسپکتیو و عمق میدان را نمی‌خورد و می‌تواند با کمک مدل یادگیری ماشینی که آن را توسعه داده است، تمام مواد را شناسایی کند.

اگرچه آنها الگوی خود را تنها با استفاده از داده‌های مصنوعی، (داده‌ها به‌دست رایانه‌ای که صحنه‌های سه‌بعدی را برای فرآوری نگاره‌های گوناگون تغییر می‌دهد، ساخته می‌شوند) آموزش داده‌اند؛ ولی این سامانه به‌طور کارآمد در صحنه‌های «درونی و بیرونی راستین» چنان خوب کار می‌کند، که پیشتر هرگز ندیده است.

این رویکرد همچنین می‌تواند برای فیلم و تصاویر متحرک نیز استفاده شود، هنگامی‌که کاربر یک پیکسل را در فریم اول شناسایی کرد، الگو می‌تواند اشیاء ساخته‌شده از همان مواد را در دیگر قاب‌های آن ویدیو نیز شناسایی کند.

همچنین می توان از تکنیک محققان برای انتخاب مواد مشابه در یک ویدیو استفاده کرد. کاربر یک پیکسل را در فریم اول شناسایی می کند (نقطه قرمز در تصویر سمت چپ روی پارچه زرد) و سیستم به طور خودکار اشیاء ساخته شده از همان مواد را در بقیه ویدیو شناسایی می کند.

علاوه بر کاربردهایی که این فناوری برای درک صحنه‌های روباتیک دارد، این روش می‌تواند برای ویرایش تصویر یا گنجاندن نگاره‌ها در سامانه‌های محاسباتی که پارامترهای مواد را در تصاویر استنتاج می‌کند، استفاده شود و همچنین می‌تواند برای سامانه‌های «توصیه وب مبتنی بر مواد» نیز مورداستفاده قرار گیرد. (مثلاً شاید یک خریدار به دنبال لباسی باشد که از نوع خاصی از پارچه ساخته‌شده باشد.)

پرافول شارما، دانشجوی فارغ‌التحصیل مهندسی برق و علوم رایانه و نویسنده اصلی این پژوهش در مورد این تکنیک می‌گوید: «دانستن اینکه با چه موادی در حال تعامل هستید اغلب بسیار مهم است. اگرچه ممکن است دو جسم بسیار شبیه به هم به نظر برسند، اما می‌توانند خواص مادی متفاوتی داشته باشند. روش ما می‌تواند انتخاب تمام پیکسل‌های دیگر در یک تصویر را که از همان ماده ساخته‌شده‌اند، تسهیل کند.»

نویسندگان این پژوهش عبارت‌اند از «جولین فیلیپ و مایکل وست»، پژوهشگران Adobe Research و همچنین نویسندگان ارشد «ویلیام تی فریمن، پروفسور توماس و گرد پرکینز» در مهندسی برق و علوم رایانه و عضو آزمایشگاه علوم رایانه و هوش مصنوعی CSAIL.


نظر شما :