Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 178|回復: 0
打印 上一主題 下一主題

耗時两年,谷歌用强化學習打造23個機器人帮助垃圾分類

[複製鏈接]

2752

主題

2754

帖子

8607

積分

管理員

Rank: 9Rank: 9Rank: 9

積分
8607
跳轉到指定樓層
樓主
發表於 2024-6-11 13:09:46 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
强化進修在该大范围利用中的示用意。利用剧本天生的数据指导计谋的启動(左上图)。然後练習一個從仿真到現實的模子,在仿真情况中天生分外的数据(右上图)。在每一個摆設周期中,添加在 “robot classrooms” 中采集的数繪畫本, 据(右下图)。在辦公楼中摆設和采集数据(左下图)。

這里利用的强化進修框架基于 QT-Opt,實行室情况下的分歧垃圾的抓取和一系列其他技術也是利用该框架。在仿真情况中從简略的剧本计谋起頭指导,利用强化進修,并利用基于 CycleGAN 的迁徙法子,操纵 RetinaGAN 使仿真图象看起来加倍傳神。

到此就起頭進入 “robot classrooms”。固然現實的辦公楼可以供给最真正的體驗,但数据采集的吞吐量是有限的 —— 有些時候會有不少垃圾必要分類,有些時候则不會有那末多。呆板人在 “robot classrooms” 中堆集了大部門的履历。

當這些呆板中和抽化糞池,人在 “robot classrooms” 接管练習時,其它呆板人正在 3 座辦公楼中的 30 個垃圾站上同時進修。

分類機能

终极,钻研职員從 “robot clas娛樂城推薦,srooms” 采集了 54 万個實驗数据,在現實摆設情况采集了 32.5 万個實驗数据。跟着数据的不竭增长,全部體系的機能获得了改良。钻研者在 “robot classrooms” 中對终极體系举行了评估,以便举行受控比力,按照呆板人在現實摆設中看到的環境設置了場景。终极體系的均匀正确率约為 84%,跟着数据的增长,機能稳步提高。在實際世界中,钻研职員記實了 2021 年至 2022 年現實摆設的统计数据,發明體系可以按重量将垃圾桶中的污染物削減 40%至 50%。google钻研职員在論文供给了有關技能設計、各類設計决议计划的減弱钻研和實行的更具體统计数据的更深刻看法。

结論和将来事情预測

實行成果表白,基于强化進修的體系可使呆板人在真實辦公情况中處置現實使命。離线和在线数据的連系使得呆板人可以或许顺應真實世界中遍及變革的環境。同時,在加倍受控的 “讲堂” 情况中進修,包含在仿真情况和現實情况中,可以供给壮大的启念頭制,使得强化進修的 “飞轮” 起頭滚動,從而實現顺應性。

固然已取患了首要功效,但另有不少事情必要完成:终极的强化進修计谋其實不老是樂成的,必要更壮大的模子来改良其機能,并清潔手套,将其扩大到更遍及的使命范畴。除此以外,其它履历来历,包含来自其它使命、其它呆板人,乃至是互联网视频,也可能會進一步弥补從仿真和” 讲堂 “中得到的启動履历。這些都是将来必要解决的問題。
回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|小黑屋|台灣資源回收交流論壇  

彰化當舖, 廚餘機, 空壓機, 滑鼠墊,, 夾克, 背心, 廢鐵回收, 家電回收, 廚餘回收, 食用油回收, 事業廢棄物再利用, 廚餘回收再利用, 台北市汽車借款, 團體制服, 運動世界,, 戰績網,, 貴金屬回收, 嘉義汽車借款, 空壓機, 團體服, 貸款, L夾, 未上市台中搬家, 氣密窗. 床墊, 世界杯運彩場中LEO娛樂運彩單場運動彩場中投注HOYA娛樂城拼多多娛樂城GS娛樂城bcr娛樂城, 九州娛樂城, q8娛樂城, 台北招牌設計, 汐止當舖未上市股票, 支票借錢, 信用卡換現金荷重元, 資料擷取DAQ, 邱大睿,

GMT+8, 2024-11-21 17:19 , Processed in 0.089108 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回復 返回頂部 返回列表