無人系統(tǒng)的自主決策與協(xié)同環(huán)境探索
報告時間:2021年12月3日(周五)下午3:00
報告地點(diǎn): 計算所446會議室
邀請人:李瑋 副研究員
論壇報告1:自動駕駛中可信賴的強(qiáng)化學(xué)習(xí)決策方法研究與應(yīng)用
摘要:自動駕駛汽車目前正處于從典型場景應(yīng)用向大規(guī)模開放道路應(yīng)用的關(guān)鍵節(jié)點(diǎn),其自主決策方法面臨駕駛環(huán)境的復(fù)雜隨機(jī)性帶來的挑戰(zhàn)。強(qiáng)化學(xué)習(xí)決策方法能夠利用試錯學(xué)習(xí)機(jī)制適應(yīng)環(huán)境特征,是目前自動駕駛智能決策領(lǐng)域的前沿方向。其瓶頸在于存在黑盒決策特點(diǎn),導(dǎo)致決策失效難以追溯應(yīng)對,這與車輛高可靠性需求相矛盾,極大地制約了該技術(shù)在自動駕駛上的應(yīng)用。本次報告將分享我們團(tuán)隊對可信賴的強(qiáng)化學(xué)習(xí)決策方法開展的研究,包括導(dǎo)致低可信性的部分原因分析和補(bǔ)償方法。所提出的方法已在自動駕駛汽車上開展了數(shù)百公里的開放道路測試,通過65項功能場景的第三方測試,實(shí)現(xiàn)了強(qiáng)化學(xué)習(xí)決策的長距離開放道路駕駛,服務(wù)于北京科技冬奧自動駕駛示范項目。
嘉賓簡介:
曹重,清華大學(xué)車輛與運(yùn)載學(xué)院博士后,2020年獲清華大學(xué)工學(xué)博士學(xué)位,曾于2017-2019年在美國密歇根大學(xué)MCITY自動駕駛測試中心進(jìn)行聯(lián)合培養(yǎng),研究領(lǐng)域包括自動駕駛自主決策、強(qiáng)化學(xué)習(xí)、持續(xù)學(xué)習(xí)等。主持國家自然科學(xué)基金青年基金“自動駕駛可信賴的強(qiáng)化學(xué)習(xí)決策方法”、博士后基金面上項目“面向長尾場景的自動駕駛汽車決策持續(xù)學(xué)習(xí)方法研究”,參與北京科技冬奧項目、北美豐田項目等。發(fā)表論文19篇,申請/授權(quán)專利15項,獲得由Waymo等公司支持的CARLA仿真挑戰(zhàn)賽獲決策組第2/68名(排序1/3),獲清華大學(xué)水木學(xué)者稱號、中國汽車工程學(xué)會優(yōu)秀博士論文提名。
論壇報告2:通信受限條件下的多智能體協(xié)同環(huán)境探索
摘要:自主對環(huán)境未知區(qū)域進(jìn)行探索,是機(jī)器人領(lǐng)域的基礎(chǔ)任務(wù)。采用多個智能體對環(huán)境進(jìn)行協(xié)同探索,相比于單個機(jī)器人獨(dú)立探索,可以成倍提升探索效率,對于搶險救災(zāi)等時間敏感的任務(wù)具備重大意義。 實(shí)際環(huán)境中,由于基礎(chǔ)設(shè)施損壞,如通信基站損毀或者GNSS信號干擾,導(dǎo)致通信和定位受限,成為了多機(jī)環(huán)境探索系統(tǒng)應(yīng)用的重大阻礙。本報告面向通信受限條件下的多機(jī)協(xié)同環(huán)境探索任務(wù),針對2D環(huán)境探索,提出了基于子地圖的多機(jī)環(huán)境探索框架降低了30%以上的數(shù)據(jù)傳輸需求和時間。針對3D環(huán)境探索,利用混合高斯模型完成地圖表示,將數(shù)據(jù)需求降低2個數(shù)量級。針對環(huán)境目標(biāo)搜索等任務(wù),利用拓?fù)涔?jié)點(diǎn)完成地圖表示,進(jìn)一步降低多機(jī)間通信量需求。
嘉賓簡介:
余金城,清華大學(xué)電子系博士后。2021年于清華大學(xué)電子系取得工學(xué)博士學(xué)位,主要研究方向是計算和通信資源受限條件下的多機(jī)協(xié)同智能系統(tǒng)。包括領(lǐng)域?qū)S糜布铀倨髟O(shè)計、多機(jī)協(xié)同系統(tǒng)與算法研究、支持協(xié)同系統(tǒng)任務(wù)的云機(jī)器人平臺和云測試場研究。在ICRA、DAC等會議和期刊上發(fā)表論文18篇。獲清華大學(xué)水木學(xué)者稱號。