動(dòng)作捕捉系統(tǒng)用于機(jī)械臂運(yùn)動(dòng)規(guī)劃與模仿學(xué)習(xí)
-
2022-11-17
-
深圳市瑞立視多媒體科技有限公司
- 瀏覽量:1006
- 分享次數(shù):0
近年來(lái),隨著機(jī)器人研究的不斷發(fā)展,越來(lái)越多的功能需要機(jī)器人來(lái)實(shí)現(xiàn),相應(yīng)的行為也越來(lái)越復(fù)雜。簡(jiǎn)單的運(yùn)動(dòng)控制已經(jīng)不能滿足要求,特別是對(duì)于一些難以獲得運(yùn)動(dòng)規(guī)律的任務(wù),傳統(tǒng)的控制方法無(wú)法實(shí)現(xiàn)。這就要求機(jī)器人具有更高的學(xué)習(xí)能力,能夠與環(huán)境動(dòng)態(tài)交互,應(yīng)對(duì)未知情況。
機(jī)器學(xué)習(xí)可以用來(lái)解決機(jī)器人應(yīng)用問(wèn)題,即在傳統(tǒng)方法失效的情況下,可以找到有效的策略來(lái)完成任務(wù)。機(jī)器學(xué)習(xí)算法可以分為三類:有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。其中,強(qiáng)化學(xué)習(xí)常用于處理復(fù)雜的決策任務(wù),但決策空間往往巨大,且強(qiáng)化學(xué)習(xí)需要不斷試錯(cuò),因此樣本復(fù)雜度往往較高,限制了強(qiáng)化學(xué)習(xí)在某些場(chǎng)景中的應(yīng)用。
模仿學(xué)習(xí)是強(qiáng)化學(xué)習(xí)的一個(gè)分支,它直接從專家樣本中學(xué)習(xí)。由于高質(zhì)量的決策行為數(shù)據(jù),模仿學(xué)習(xí)被認(rèn)為是降低樣本復(fù)雜度的一種手段。模仿也叫LearningfromDemenstration,通過(guò)指導(dǎo)者的動(dòng)作和代碼回歸得到一個(gè)優(yōu)化的機(jī)器人軌跡。模仿學(xué)習(xí)時(shí),指導(dǎo)者根據(jù)任務(wù)要求對(duì)軌跡進(jìn)行示教,并以相應(yīng)的方式記錄示教軌跡。