原標題:谷歌機器人學會自己走路,完全不需要人工干預
研究者的新研究取得了很大的進展,機器人可以學會走路而無需人工干預。 在幾個小時內,僅依靠現在最先進的算法的微調,就成功地讓四條腿的機器人學習了完全獨立的前進和后退、左右轉彎。
圖|機器人在包括平地(上)、內存格式床墊(中)、拔出空的門板(下)在內的各種地形上學習自主步行(來源: arxiv )。
這項事業是基于一年前的研究,當時的研究小組首次發現了如何讓機器人在現實世界中學習。
迄今為止,強化學習是在仿真環境中進行的,直到機器人的虛擬分身算法充分完善,安全動作為止。 然后把它引進真正的機器人。
這種方法有助于防止機器人在重復實驗中損傷周圍的環境,但需要容易建模的環境。 模擬在機器人腳下自然散落的沙礫和彈簧床墊需要很長時間,不值得。
基于這種情況,研究者決定從一開始就不通過在現實世界中訓練來建模困難的環境。 他們設計了更高效的算法,減少了學習的實驗次數,可以在兩個小時內讓機器人站起來走路。 由于實際環境有自然的變化,機器人也能迅速應對傾斜、樓梯、殘疾平地等其他類似的環境。
但是,這個過程依然需要人類幫助機器人,數百次手動介入,谷歌Brain機器人運動隊負責人、論文共作者譚杰(音譯)說:“最初還不認為需要人工介入。”
于是他們開始處理這個新問題。 首先,他們限定了機器人可以搜索的地形,避免一次重復多重動作訓練。 學習機器人前進的方法,到達限定地形的邊緣后,開始學習改變方向,向后走的方法。
其次,研究者限制了機器人的訓練動作,慎重地將反復跌倒造成的傷害降到了最小限度。 機器人不由得摔倒的時候,他們添加了另一個硬編碼算法來幫助它站起來。
通過這些調整,機器人學會了在平地、記憶床墊、有間隙的墊子等幾個不同的環境中自主行走的方法。 這個實驗給將來的應用帶來了可能性,有時機器人需要在沒有人的情況下在搖滾和未知的地形上行走。
斯坦福大學的切爾西芬副教授( chelsea finn )說:“這項事業很令人興奮。” 芬恩也為谷歌工作,但不參與這項研究。 “讓這個過程不要人工介入真的不容易。 如果機器人能更自主地學習,就更有可能在我們生活的現實世界而不是實驗室學習。 ”。
但是,現在的設置依賴于機器人上方的運動捕捉系統,也注意到明確了其位置。 這在現實世界中是不可能的。
其次,我希望他們的算法適用于不同種類的機器人,或者多個機器人可以在同一個環境中學習。 譚杰相信解讀機器人的運動能力是解鎖越來越多有用的機器人的關鍵。
他說:“很多地方是為人類做的,我們用腳走路。” “機器人不用腳的話,就不能在人類的世界里行走。 ”。
全天候滾動播放最新的財經信息和視頻,越來越多的粉絲福利掃描二維碼備受關注( finance )。
標題:【熱門】谷歌機器人自己學會走路,完全無需人工干預
地址:http://m.swled.com.cn/gphq/2886.html