texplore: real-time sample-efficient reinforcement learning for robots : تی پی بین

texplore: real-time sample-efficient reinforcement learning for robots

texplore: real-time sample-efficient reinforcement learning for robots
نویسندگان :

todd hester

peter stone
کلمات کلیدی :

real

time

robotics

reinforcement learning

mdp
جزئیات بیشتر مقاله
- تاریخ ارائه: 1392/07/24
- تاریخ انتشار در تی پی بین: 1392/07/24
- تعداد بازدید: 1192
- تعداد پرسش و پاسخ ها: 0
- شماره تماس دبیرخانه رویداد: -
the use of robots in society could be expanded by using reinforcement learning (rl) to allow robots to learn and adapt to new situations online. rl is a paradigm for learning sequential decision making tasks, usually formulated as a markov decision process (mdp). for an rl algorithm to be practical for robotic control tasks, it must learn in very few samples, while continually taking actions in real-time. in addition, the algorithm must learn efficiently in the face of noise, sensor/actuator delays, and continuous state features. in this article, we present texplore, the first algorithm to address all of these challenges together. texplore is a model-based rl method that learns a random forest model of the domain which generalizes dynamics to unseen states. the agent explores states that are promising for the final policy, while ignoring states that do not appear promising. with sample-based planning and a novel parallel architecture, texplore can select actions continually in real-time whenever necessary. we empirically evaluate the importance of each component of texplore in isolation and then demonstrate the complete algorithm learning to control the velocity of an autonomous vehicle in real-time.

سوال خود را در مورد این مقاله مطرح نمایید :

سوال شما برای نویسنده مقاله نیز ارسال می گردد.در صورت درج پاسخ از طریق ایمیل به شما اطلاع داده خواهد شد.
با انتخاب دکمه “ثبت پرسش”، موافقت خود را با قوانین انتشار محتوا در تی پی بین اعلام می کنم.

در صورت درج پاسخ از طریق ایمیل به شما اطلاع داده خواهد شد.

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم

texplore: real-time sample-efficient reinforcement learning for robots

todd hester

peter stone

سوال خود را در مورد این مقاله مطرح نمایید :

استفاده از تحلیل اهمیت-عملکرد در ارائه الگوی مدیریت خلاقیت سازمانی و ارائه راهکار جهت بهبود

بررسی تاثیر ارزش وجوه نقد مازاد بر ساختار سرمایه شرکت های پذیرفته شده در بورس اوراق بهادار تهران

بررسی تأثیر سطح افشای ریسک بر قرارداد بدهی شرکت های پذیرفته شده در بورس اوراق بهادار تهران

بررسی تأثیر رتبه بندی اعتباری مبتنی بر مدل امتیاز بازار نوظهور بر نقد شوندگی سهام با تأکید بر خصوصی سازی شرکت ها

تأثیر آمیخته بازاریابی پوشاک ایرانی بر تصویر ذهنی مشتری پوشاک ایرانی (هاکوپیان)

تاثیر هشت هفته تمرین هوازی ومقاومتی برانجام فعالیت های روزانه، استقامت راه رفتن وکیفیت زندگی مرتبط باتندرستی سالمندان

آیا معاملات اشخاص وابسته همواره اطلاع رسانی عواید را بدتر می کند؟

تاثیر عناصر فرهنگی در ساماندهی ورودی شهر نمونه موردی: ورودی خوی - قطور شهر خوی

طراحی مجتمع تجاری با رویکرد اهمیت انرژی پاک خورشیدی و چگونگی مصرف انرژی

a review – status of co2 as a low temperature refrigerant: fundamentals and r&d opportunities

مدیریت و بررسی افسردگی دانش آموزان دختر مقطع متوسطه دوم در دروان کرونا در شهرستان دزفول

مدیریت و بررسی خرد سیاسی در اندیشه ی فردوسی در ادب ایران

واکاوی و مدیریت توصیفی قلمدان(جاکلیدی)ضریح در موزه آستان قدس رضوی

بررسی تاثیر خلاقیت، دانش و انگیزه کارکنان بر پیشنهادات نوآورانه کارکنان ( مورد مطالعه: هتل های 3 و 4 ستاره استان کرمان)

بررسی تاثیر کیفیت سیستم های اطلاعاتی بر تصمیم گیری موفق در شرکتهای تولیدی استان اصفهان (مورد مطالعه: مدیران شرکتهای تولیدی استان اصفهان)

پیش بینی بخشودگی زناشویی بر اساس تنظیم هیجان، دلبستگی به خدا و راهبرد مقابله دین محور در زنان دارای تجربه خشونت خانوادگی

مسئولیت مدنی سبب مجمل در حقوق مدنی ایران و فقه امامیه

سنجش رابطه عوامل مؤثر بر میزان بهره وری منابع انسانی (نمونه مورد مطالعه: آموزش و پرورش منطقه 6 تهران)

کالبد شناسی مفهوم تعهد

recycled aggregate self-curing high-strength concrete

texplore: real-time sample-efficient reinforcement learning for robots

todd hester

peter stone

سوال خود را در مورد این مقاله مطرح نمایید :

استفاده از تحلیل اهمیت-عملکرد در ارائه الگوی مدیریت خلاقیت سازمانی و ارائه راهکار جهت بهبود

بررسی تاثیر ارزش وجوه نقد مازاد بر ساختار سرمایه شرکت های پذیرفته شده در بورس اوراق بهادار تهران

بررسی تأثیر سطح افشای ریسک بر قرارداد بدهی شرکت های پذیرفته شده در بورس اوراق بهادار تهران

بررسی تأثیر رتبه بندی اعتباری مبتنی بر مدل امتیاز بازار نوظهور بر نقد شوندگی سهام با تأکید بر خصوصی سازی شرکت ها

تأثیر آمیخته بازاریابی پوشاک ایرانی بر تصویر ذهنی مشتری پوشاک ایرانی (هاکوپیان)

تاثیر هشت هفته تمرین هوازی ومقاومتی برانجام فعالیت های روزانه، استقامت راه رفتن وکیفیت زندگی مرتبط باتندرستی سالمندان

آیا معاملات اشخاص وابسته همواره اطلاع رسانی عواید را بدتر می کند؟

تاثیر عناصر فرهنگی در ساماندهی ورودی شهر نمونه موردی: ورودی خوی - قطور شهر خوی

طراحی مجتمع تجاری با رویکرد اهمیت انرژی پاک خورشیدی و چگونگی مصرف انرژی

a review – status of co2 as a low temperature refrigerant: fundamentals and r&amp;d opportunities

مدیریت و بررسی افسردگی دانش آموزان دختر مقطع متوسطه دوم در دروان کرونا در شهرستان دزفول

مدیریت و بررسی خرد سیاسی در اندیشه ی فردوسی در ادب ایران

واکاوی و مدیریت توصیفی قلمدان(جاکلیدی)ضریح در موزه آستان قدس رضوی

بررسی تاثیر خلاقیت، دانش و انگیزه کارکنان بر پیشنهادات نوآورانه کارکنان ( مورد مطالعه: هتل های 3 و 4 ستاره استان کرمان)

بررسی تاثیر کیفیت سیستم های اطلاعاتی بر تصمیم گیری موفق در شرکتهای تولیدی استان اصفهان (مورد مطالعه: مدیران شرکتهای تولیدی استان اصفهان)

پیش بینی بخشودگی زناشویی بر اساس تنظیم هیجان، دلبستگی به خدا و راهبرد مقابله دین محور در زنان دارای تجربه خشونت خانوادگی

مسئولیت مدنی سبب مجمل در حقوق مدنی ایران و فقه امامیه

سنجش رابطه عوامل مؤثر بر میزان بهره وری منابع انسانی (نمونه مورد مطالعه: آموزش و پرورش منطقه 6 تهران)

کالبد شناسی مفهوم تعهد

recycled aggregate self-curing high-strength concrete

a review – status of co2 as a low temperature refrigerant: fundamentals and r&d opportunities