هوش مصنوعی RT-2 گوگل گامی نزدیکتر به ربات هایی که می توانند مانند انسان ها یاد بگیرند
گوگل مدل جدیدی از هوش مصنوعی معرفی کرد، که به انسان اجازه میدهد با رباتها ارتباط برقرار کند و به آنها نحوه بکار بردند درست کلمات را یاد دهند.
مفهوم رباتها بهعنوان کمککنندگان قابل اعتماد، بخشی از تصورات جمعی ما برای دههها بوده است. علیرغم چشم اندازهای آینده نگر، تحقق عملی این دستیاران رباتیک بیشتر علمی تخیلی بوده تا واقعیت. با تشکر از تیم تحقیقاتی DeepMind گوگل، ما نگاهی اجمالی به یک پیشرفت هیجان انگیز داریم که قرار است قلمرو رباتیک را دوباره تعریف کند:
معرفی Robotics Transformer 2 (RT-2). یک مدل بینایی-زبان-عملی پیشگام است که با استفاده از تکنیکهای مبتنی بر ترانسفورماتور توسعه یافته و بر روی دادههای متن و تصویر جمعآوریشده از وب آموزش دیده است. نوآوری کلیدی آن در توانایی در، خروجی مستقیم اقدامات رباتیک نهفته است. اساساً، RT-2 مفاهیم و ایدههای کلی را از دادههای وب میآموزد و سپس آن دانش را برای اطلاعرسانی رفتارهای روباتیک به کار میگیرد و به طور مؤثری رباتها را قادر میسازد تا زبان عملیات خود را بفهمند و «تکلم کنند».
یادگیری ربات در دنیای واقعی همیشه چالش های بزرگی را به همراه داشته است. برای اینکه یک ربات بتواند وظایف کلی را در محیط های متغیر انجام دهد، باید وظایف پیچیده و انتزاعی را مدیریت کند، به ویژه در محیط هایی که قبلاً با آن مواجه نشده بود. برخلاف chatbots ها، رباتها در دنیای واقعی نیاز به زمین دارند. آنها نیاز به درک مفاهیم انتزاعی و نحوه به کارگیری آنها در زمینه های عملی و فیزیکی دارند. از لحاظ تاریخی، رباتها به آموزش روی میلیاردها نقطه داده نیاز داشتهاند که شامل هر شی، محیط، کار و موقعیت قابل تصور در دنیای فیزیکی است. این فرآیند برای نوآوران زمانبر، پرهزینه و اغلب غیرعملی بوده است. در نتیجه، یادگیری ربات، همیشه یک کار دشوار بوده است.RT-2 نشان دهنده انحراف قابل توجهی از روش های سنتی آموزش ربات است. پیشرفتهای اخیر در فناوریهای رباتیک توانایی رباتها را برای استدلال و تشریح مشکلات چند مرحلهای بهبود بخشیده است، با مدلهای بینایی مانند PalM-E به رباتها در درک بهتر محیط اطرافشان کمک میکند. مدلهای قبلی مانند RT-1 نشان دادند که ترانسفورماتورها که به دلیل ظرفیتشان برای تعمیم اطلاعات در سیستمها شناخته شدهاند، میتوانند یادگیری را در انواع مختلف رباتها تسهیل کنند.
قبل از RT-2، رباتها برای عملیات به پشتههای سیستمی پیچیده تکیه میکردند، جایی که سیستمهای استدلال سطح بالا و دستکاری سطح پایین با هم کار میکردند تا عملکرد ربات را ایجاد کنند. این رویکرد دست و پا گیر قابل مقایسه با پردازش ذهنی هر مرحله ای است که می خواهید قبل از حرکت فیزیکی بردارید. RT-2 این کار را با ترکیب استدلال پیچیده و خروجی عمل در یک مدل ساده می کند. یکی از ویژگیهای مهم RT-2 توانایی آن در انتقال مفاهیم به دست آمده از دادههای آموزش زبان و بینایی برای هدایت اقدامات روباتیک است، حتی برای کارهایی که به طور خاص برای انجام آن آموزش ندیدهاند.
به عنوان مثال، وظیفه دفع زباله را در نظر بگیرید. سیستمهای سنتی برای شناسایی زبالهها، جمعآوری و دور ریختن زبالهها به آموزش دقیق نیاز دارند. از سوی دیگر، RT-2 با انتقال دانش از مجموعه بزرگی از دادههای وب، از قبل میداند زباله چیست و میتواند آن را بدون آموزش صریح شناسایی کند. حتی میداند که چگونه زبالهها را بدون اینکه برای این کار آموزش دیده باشد دفع کند.
توانایی RT-2 برای انتقال اطلاعات به ربات ها اجازه می دهد تا به سرعت با موقعیت ها و محیط های جدید سازگار شوند. در بیش از 6000 کارآزمایی رباتیک، RT-2 همانند نسخه قدیمی تر خود(RT-1) وظایفی را که برای آنها آموزش دیده بود، انجام داد، در حالی که عملکرد خود را در سناریوهای جدید و نادیده تقریبا دو برابر کرد، از 32٪ با RT-1 به 62٪ با RT-2.
از این نظر، RT-2 به رباتها این امکان را میدهد تا مانند انسانها، مفاهیمی را که قبلاً آموختهاند، در موقعیتهای جدید به کار ببرند. در حالی که کار قابل توجهی برای تحقق ربات های واقعاً مفید در محیط های انسان محور باقی مانده است، RT-2 نمایانگر یک نگاه اجمالی هیجان انگیز به آینده وسوسه انگیز رباتیک است. ظهور مدل هایی مانند RT-2 گواهی بر این است که چگونه پیشرفت های هوش مصنوعی به سرعت بر روباتیک تأثیر می گذارد. این نوید بزرگی برای توسعه ربات های همه کاره تر و همه منظوره دارد.
در انتها پیشنهاد میکنیم که مقاله ظهور شهرهای هوشمند در عصر دیجیتال را نیز مطالعه فرمایید چرا که با توسعه عصر دیجیتال، ایده شهرهای هوشمند در حال شکل گیری است.
منبع: Forbes Janakiram MSV Senior Contributor
ترجمه شده در واحد هوش بازار TMBA