ابداع چارچوبی برای تقویت تقلید در ربات ها

به گزارش وبلاگ مایکروتاچ، پژوهشگران آمریکایی، چارچوبی برای آموزش ربات ها ابداع نموده اند که می تواند تقلید کردن را در آنها تقویت کند.

ابداع چارچوبی برای تقویت تقلید در ربات ها

به گزارش وبلاگ مایکروتاچ و به نقل از تک اکسپلور، گروه های پژوهشی سراسر دنیا در سال های اخیر از یکی از گرایش های یادگیری ماشینی موسوم به یادگیری تقویتی(Reinforcement learning) استفاده نموده اند تا نحوه انجام دادن وظایف گوناگون را به ربات ها آموزش دهند اما آموزش این الگوریتم ها می تواند بسیار چالش برانگیز باشد زیرا به کوشش های اساسی انسان در تعریف وظایف برای ربات احتیاجمند است.

یکی از روش های آموزش ربات ها برای انجام وظایف گوناگون این است که این آموزش به واسطه فعالیت های انسانی صورت بگیرد. این روش، بسیار سخت به نظر می رسد زیرا ربات ها و انسان ها، بدن های متفاوتی دارند و می توانند حرکات متفاوتی انجام دهند.

پژوهشگران دانشگاه کالیفرنیا، برکلی(UC Berkeley) اخیرا چارچوب جدیدی ابداع نموده اند که شاید بتواند بر بعضی از چالش های مربوط به آموزش ربات ها غلبه کند. این چارچوب موسوم به AVID، بر پایه دو مدل یادگیری عمیق ابداع شده که مبتنی بر آنالیز پیشین این پژوهشگران هستند.

لائورا اسمیت(Laura Smith)، از پژوهشگران این پروژه گفت: ما برای ابداع AVID، بر دو پژوهش اخیر خود موسوم به CycleGAN و SOLAR تمرکز کردیم که برای معین کردن محدودیت های بنیادی در حوزه آموزش به ربات ها اجرا شده اند.

اسمیت و همکارانش به جای استفاده از روش هایی که به تفاوت میان بدن ربات و انسان توجه نمی نمایند، روش Cycle-GAN را به کار بردند که می تواند تصاویر را در قالب پیکسل تغییر دهد. این روش توانست روش کار انسان در انجام دادن یک وظیفه را به صورت ویدئوهایی از یک ربات ارائه دهد که همان کار را انجام می دهد. آنها سپس از این ویدئو برای ابداع یک عملکرد پاداش برای الگوریتم یادگیری تقویتی استفاده کرددند.

اسمیت اضافه کرد: AVID رباتی را شامل می گردد که عملکرد انسان را برای انجام دادن یک وظیفه مورد آنالیز قرار می دهد و سپس تصور می نماید که انجام دریافت این کار توسط ربات چگونه خواهد بود. ما برای یاد دریافت نحوه دستیابی به این موفقیت، به ربات اجازه دادیم تا خودش کار را به واسطه آزمون و خطا یاد بگیرد.

ربات با استفاده از چارچوب ابداع شده توسط اسمیت و همکارانش توانست وظایف را فورا در مرحله نخست یاد بگیرد و آن را دوباره بدون احتیاج به یاری انسان تکرار کند. فرآیند یادگیری با یادگیری مهارت های جدید توسط ربات و حداقل دخالت انسان، تا اندازه زیادی اتوماتیک شد.

اسمیت ادامه داد: یکی از مزایای اصلی روش ما این است که یک آموزگار انسان می تواند با دانش آموز ربات خود تعامل داشته باشد. ما چارچوب یادگیری خود را طوری طراحی نموده ایم که قابلیت یادگیری رفتار بلندمدت را با کمترین میزان کوشش داشته باشد.

پژوهشگران، روش خود را در مجموعه ای از آزمایش ها مورد آنالیز قرار دادند و دریافتند که این روش می تواند نحوه انجام دادن کارها را به صورت کارآمد به ربات ها آموزش دهد.

منبع: خبرگزاری ایسنا

به "ابداع چارچوبی برای تقویت تقلید در ربات ها" امتیاز دهید

امتیاز دهید:

دیدگاه های مرتبط با "ابداع چارچوبی برای تقویت تقلید در ربات ها"

* نظرتان را در مورد این مقاله با ما درمیان بگذارید