صنعت منطق روبات های خودگردان
مهندسان دانشگاه MIT، یک ابراز طراحی عمومی برای متخصصان روبات، طراحی کرده اند تا به عنوان فرمول موفقیت، استفاده شود. کدهای بهینه ساز این ابزار، میتوانند برای شبیه سازی تقریبا هر نوع سیستم روباتیک خودگردانی به کار روند و نیز میتوانند برای تشخیص خودکار نحوه و محل چرخاندن سیستم، به منظور بهبود عملکرد روبات، استفاده شوند.
یک بهینه ساز چندمنظوره میتواند طراحی سیستم های خودگردان ازجمله روبات های راه رونده، و وسایل نقلیه ی خودران، را تسریع کند.
از روبات جاروبرقی و وسواسی «رومبا» تاکنون، روبات های خودگردان راهی طولانی را پیموده اند. در سال های اخیر، سیستم های مبتنی بر هوش مصنوعی در اتومبیل های خودران، بسته بندی در انبار، گرفتن عکس پزشکی از بیماران، تحویل غذا به دورترین نقطه ی محدوده، نظافت بیمارستان، خدمات رستورانی، آماده سازی گوشت، و امنیت ساختمان، گسترش یافته اند.
هریک از این سیستم های روباتیک، محصول یک فرایند طراحی، برای هدفی ویژه، و صرفا برای همان سیستم بخصوص، هستند. این بدان معناست که در طراحی یک روبات خودگردان، مهندسان بایستی شبیه سازی هایی بر پایه ی آزمون وخطاهای بی شمار انجام دهند که اغلب مواقع، با درک و شهود خود، به آنها پی میبرند. این شبیه سازی ها، صرفا برای اجزا و وظایف یک روبات بخصوص، و به منظور تنظیم و بهینه کردن عملکرد آن، ساخته وپرداخته میشوند. امروزه طراحی یک روبات خودگردان، از برخی جهات، بسیار شبیه پختن یک کیک، از صفر است: بدون هیچ دستورپخت یا ترکیب آماده ای که نسبت به موفق آمیز بودن نتیجه، اطمینان خاطر دهد.
بهبود سیستم های روباتیک خودگردان
یک ابزار بهینه ساز چندمنظوره ی جدید، قادر است عملکرد بسیاری از سیستم های روباتیک خودگردان را بهبود بخشد. آنچه در اینجا نشان داده شده، یک سخت افزار نمایشی است که در آن، ابزار یاد شده، بطور خودکار، عملکرد دو روبات که برای جا به جایی یک جعبه ی سنگین، همکاری میکنند را بهینه میکند. تجلیل: عرض ارادت به پژوهشگران
حالا، مهندسان دانشگاه MIT یک ابزار با طراحی عمومی را برای استفاده به عنوان یک «فرمول خودکار برای موفقیت»، ساخته اند. کد طراحی، جوری تعبیه شده که میتواند تقریبا برای تمام سیستم های روباتیک خودگردان، به کار گرفته شود و میتواند برای تشخیص خودکار نحوه و محل چرخاندن سیستم، برای بهبود عملکرد روبات، استفاده شود.
مهندسان MIT نشان دادند که این ابزار قادر بود عملکرد دو سیستم خودگردان کاملا متفاوت (یکی سیستمی که در آن، یک روبات در مسیری میان دو مانع، حرکت میکرد، و دیگری، سیستمی که در آن، دو روبات برای جا به جایی یک جعبه ی سنگین، همکاری می کردند) را به سرعت، بهبود دهد.
این گروه امیدوار است که این بهینه ساز چند منظوره ی جدید بتواند به تسریع توسعه ی گستره ی وسیعی از سیستم های خودگردان، کمک کند، از روبات های راه رونده و وسایل نقلیه ی خودران گرفته، تا روبات های ظریف و ماهر، و گروه هایی از روبات های همکاری کننده.
این محققان، تشکیل یافته از: «چارلز داوسن»، یکی از فارغ التحصیلان MIT و «ChuChu Fan»، استادیار دپارتمان هوانوردی و فضانوردی، یافته های خود را در سالنامه ی «Robotics» ارائه کردند (در نشست «علوم و سیستم ها» در نیویورک).
طراحی معکوس
«داوسن» و «ChuChu Fan»، پس از مشاهده و بررسی تعداد کثیری از ابزارهای طراحی موجود برای سایر حوزه های مطالعاتی مهندسی، نیاز به یک ابزار بهینه ساز عمومی را تشخیص دادند.
«داوسن» میگوید: «اگر یک مهندس مکانیک میخواست یک توربین بادی طراحی کند، برای طراحی کردن ساختارش، آنها میتوانستند از ابزار 3D CAD استفاده کنند، سپس از یک تحلیل «شبیه سازی رفتاری در شرایط بخصوص»، برای بررسی احتمال مقاومت، در برابر مقدار مشخصی از بار، استفاده کنند. هرچند، جای یک ابزار طراحی به کمک رایانه، برای این سیستم های خودگردان خالی است.»
درحالت عادی، کار متخصص روبات، بهینه سازی سیستم خودگردان، نخست با ایجاد یک شبیه ساز سیستم، و بسیاری از زیرسیستم های تعامل کننده با آن، مانند زیرسیستم های برنامه ریزی، کنترل، درک، و اجزای سخت افزاری است. سپس باید مولفه های معینی از هریک از اجزا را تنظیم کند و شبیه سازی را به پیش ببرد تا ببیند سیستم در آن سناریو، چگونه فعالیت خواهد کرد.
یک متخصص روبات، صرفا پس از اجرای تعداد زیادی سناریو از طریق آزمون و خطا میتواند ترکیب بهینه ی عناصر را، برای به دست آمدن کارایی مدنظر، تشخیص دهد. این، یک پروسه ی، خسته کننده، فوق العاده خاص، و زمانبر است که «داوسن» و «فن»، به دنبال معکوس کردن آن بودند.
«داوسن» توضیح میدهد: «بجای اینکه بگوییم: «طرح، مشخص است، حالا چقدر کارایی دارد؟»، میخواستیم این را برعکس کنیم و بگوییم: «عملکردی که میخواهیم ببینیم، معین است، حال چه طرحی این عملکرد را به ما می دهد؟»».
این محققان، یک چهارچوب بهینه سازی، یا یک کد رایانه ای، ایجاد کردند که قادر است ، چرخش هایی که میتوانند انجام شوند تا سیستم خودگردان فعلی را به نتیجه ی دلخواه برسانند را، بطور خودکار پیدا کند.
قلب این کد، «تفکیک خودکار»، یا «autodiff» است (یک ابزار برنامه نویسی، که در جامعه ی یادگیری ماشینی، توسعه یافت و درابتدا برای آموزش شبکه های عصبی، استفاده میشد). Autodiff، روشی است که میتواند بطور سریع و موثری، «مشتقات» یا میزان حساسیت به تغییر، در هر یک از مولفه های یک برنامه ی کامپیوتری را «ارزیابی کند». «داوسن» و «فن»، به مرور، پیشرفت هایی در برنامه نویسیautodiff صورت دادند تا یک ابزار بهینه ساز چند منظوره برای سیستم های روباتیک خودگردان، ایجاد کنند.
«داوسن» میگوید: «روش ما بطور خودکار به ما میگوید که چطور گام های کوچک، از یک طرح اولیه، به سمت رسیدن به اهدافمان برداریم. ما از autodiff استفاده میکنیم تا اساسا به داخل کدی که شبیه ساز را تشخیص میدهد، نفوذ کنیم، و متوجه شویم که چطور این «معکوس سازی» را بطور خودکار انجام دهیم.»
ساختن روبات هایی بهتر
این گروه، ابزار جدیدش را بر روی دو سیستم روباتیک خودگردان مجزا آزمایش کرد و نشان داد که این ابزار، تمام عملکردهای سیستم را در بررسی های آزمایشگاهی، به سرعت بهبود میبخشید (در مقایسه با روش های بهینه سازی سنتی).
سیستم اول، شامل یک روبات چرخدار بود که وظیفه اش، طرح ریزی یک مسیر، بین دو مانع، و براساس علائم دریافتی از دو «برج هدایت» که در مکان های مجزا قرار داشتند، بود. گروه، به دنبال این بود که مکان هایی بهینه برای این دو برج هدایت بیابد که یک مسیر واضح، بین دو مانع، ترسیم کنند.
اعضای گروه متوجه شدند که بهینه ساز جدید، به سرعت از طریق شبیه سازی روبات، به شکل معکوس کار کرد و بهترین مکان برای برج ها را درعرض پنج دقیقه مشخص کرد (درمقایسه با پانزده دقیقه برای روش های سنتی).
سیستم دوم، پیچیده تر بود؛ تشکیل شده از دو روبات چرخ دار، که باهم کار می کردند تا جعبه ای را به سمت «موقعیت هدف»، هل دهند. شبیه سازی از این سیستم، شامل زیرسیستم ها و مولفه های بسیار بیشتری بود. بااین وجود، این ابزار، درعین بهره وری، اقدامات موردنیازی که روبات ها را به هدفشان برساند، را تشخیص داد (طی یک پروسه ی بهینه سازی، که 20برابر از روش های سنتی سریع تر بود).
«فن» میگوید: «اگر سیستم شما، مولفه های بیشتری برای بهینه شدن دارد، ابزار ما میتواند آن را خیلی بهتر انجام دهد و به شکل تصاعدی، در زمان، صرفه جویی کند. روش ما، یک انتخاب ترکیب مند است: با زیاد شدن تعداد مولفه ها، تعداد انتخاب ها نیز افزایش می یابند، و روش ما میتواند آن را با یک حرکت، کاهش دهد.»
این گروه، این بهینه ساز عمومی را برای دانلود، در دسترس قرار داده است و قصد دارد این کد را بازهم بهبود دهد تا در سیستم های پیچیده تری (مانند روبات هایی که برای تعامل و همکاری با انسان ها طراحی شده اند)، قابل استفاده باشد.
«داوسن» میگوید: «هدف ما توانمندسازی انسان ها برای ساخت روبات های بهتر است. ما درحال فراهم کردن بستری هستیم که مردم بتوانند سیستم های خود را بهینه سازی کنند و مجبور نباشند از صفر شروع کنند.»
منبع: «Certifiable Robot Design Optimization using Differentiable Programming»، نوشته ی «Charles B Dawson» و «ChuChu Fan»، ژوئن 2022، «علوم و سیستم ها 2022»
این تحقیق، در بخش هایی توسط موسسه ی علوم دفاعی و فناوری سنگاپور و MIT-IBM Watson AI Lab حمایت شد.

