哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

破解透明物體抓取難題,地瓜機器人 CASIA 推出幾何和語義融合的單目抓取方案|ICRA 2025

地瓜機器人 ? 2025-03-05 19:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

概述

近日,全球機器人領域頂會ICRA 2025(IEEE機器人與自動化國際會議)公布論文錄用結果,地瓜機器人主導研發(fā)的DOSOD開放詞匯目標檢測算法MODEST單目透明物體抓取算法成功入選。前者通過動態(tài)語義理解框架提升復雜場景識別準確率,后者結合幾何建模與語義分析技術優(yōu)化透明物體操作精度,兩項技術成果均已在規(guī)?;虡I(yè)場景中得到有效驗證。此次投稿的兩篇論文全部入選,不僅彰顯了ICRA對機器人感知領域的高度重視,同時也印證了地瓜機器人團隊在機器人視覺領域的領先優(yōu)勢。

DOSOD開放詞匯目標檢測算法,本期文章將圍繞MODEST單目透明抓取算法進行重點介紹。

作為機器人執(zhí)行各項任務中繞不開的操作對象,水杯、試管、窗戶等透明物體在人類生活中無處不在。從精密制造、醫(yī)療實驗室和家庭服務機器人等領域,透明物體的精確操作是提升自動化和智能化水平的關鍵。然而,透明物體復雜的折射和反射特性給機器人感知造成了很大困難。在大多數(shù)RGB圖像中的透明物體往往缺乏清晰的紋理,而容易與背景混為一體。此外,商用深度相機也難以準確捕捉這些物體的深度信息,導致深度圖缺失或噪聲過多,從而限制了機器人在多個領域的廣泛應用。

為了解決透明物體的抓取問題,地瓜機器人聯(lián)合中科院自動化所(簡稱:CASIA)多模態(tài)人工智能系統(tǒng)全國重點實驗室,推出了針對透明物體的單目深度估計和語義分割的多任務框架(簡稱:MODEST)。該框架借助創(chuàng)新性的語義和幾何融合模塊,結合獨特的特征迭代更新策略,顯著提升了深度估計和語義分割的效果,尤其在抓取成功率和系統(tǒng)泛化性方面取得了突破性進展。

MODEST算法框架作為通用抓取模型的前置模塊,即插即用,靈活高效,且無需依賴額外傳感器,僅靠單張RGB圖像,便可實現(xiàn)透明物體的抓取,效果上甚至要優(yōu)于其它雙目和多視圖的方法,可以廣泛應用于智能工廠、實驗室自動化、智慧家居等場景,降低設備成本并大幅提升機器人對透明物體的操作能力。

基本原理

當前透明物體的抓取核心在于深度信息的獲取,目前無論是深度傳感器還是多視角重建的方法都無法獲取透明物體準確完整的深度信息。為了解決透明物體感知難題,傳統(tǒng)方法大多依賴特殊傳感設備或多視角圖像,增加了時間和經濟成本,并常常受限于應用場景。MODEST單目框架首次突破了傳統(tǒng)傳感器處理透明物體時的限制,降低了設備成本和使用復雜度,提供了更加高效、經濟和便捷的透明物體感知方案。

wKgZO2fIImaAUTNdAAIb7m0kV_s285.png

單目透明物體感知框架與其他方法之間的對比

MODEST主要聚焦于透明物體的深度估計,通過設計的語義和幾何結合的多任務框架,獲取物體準確的深度信息,之后結合基于點云的抓取網絡實現(xiàn)透明物體的抓取。相當于在通用抓取網絡前面增加一個針對透明物體的增強模塊。

MODEST模型的整體架構如圖所示,輸入為單目RGB圖像,輸出為透明物體的分割結果和場景深度預測。網絡主要由編碼、重組、語義幾何融合迭代解碼四個模塊組成。輸入圖像首先經過基于ViT的編碼模塊進行處理,隨后重組為對應分割和深度兩個分支的多尺度特征。在融合模塊中對兩組特征進行混合和增強,最后通過多次迭代逐步更新特征,并獲得最終預測結果。

wKgZO2fIIqaAV0SNAAEczfrgSe4127.png

基于語義幾何融合和迭代策略的透明物體單目多任務框架

對于透明物體來說,語義分割任務可以為深度估計提供語義和上下文信息,而同樣深度估計可以為分割提供邊界、表面等幾何信息。為了充分挖掘兩個任務間的互補信息,MODEST算法框架構建了基于注意力機制的語義幾何融合模塊,旨在同時提升兩個任務的性能。

wKgZPGfIIuCAcWADAAG1aAjP7gQ052.png

語義幾何融合模塊結構

當人類觀察透明物體等不顯著物體時,我們會傾向于先注意物體的整體輪廓,然后是局部細節(jié)。受人眼啟發(fā),MODEST框架提出了一種由粗到細的特征更新策略,進一步提升預測精度。

實驗結果

為了測試MODEST全新算法框架的檢測效果,我們選取了透明物體領域兩個影響力廣泛的公開仿真數(shù)據(jù)集Syn-TODD和真實數(shù)據(jù)集ClearPose,在其上與目前最先進的透明物體雙目方法SimNet、多視圖方法MVTran以及多任務方法InvPT和TaskPrompter進行對比實驗。兩個大規(guī)模數(shù)據(jù)集都擁有超過100k的良好標注圖像數(shù)據(jù),并且包含了嚴重遮擋等極端場景。

公開數(shù)據(jù)集上的定性和定量對比實驗

wKgZO2fII_yAGwb3AAGND1TNR0Q332.png

仿真數(shù)據(jù)集Syn-TODD上的定性對比結果

wKgZO2fIJCyANH5cAAGhND9LzzE443.png

真實數(shù)據(jù)集ClearPose上的定性對比結果

通過在兩個數(shù)據(jù)集上的定性對比結果可以看出,由于透明物體會錯誤地折射背景,并且在RGB圖像中缺乏紋理,因此SimNet、MVTrans等方法無法獲得令人滿意的預測,從而導致深度圖和分割掩膜的大面積缺失。然而,通過有效的融合和迭代,在某些即使人眼都難以分析和判斷的場景,我們的方法依然能夠產生完整和清晰的預測結果。

wKgZO2fIJL2ALzgEAAFq2pfyAa4566.png

仿真數(shù)據(jù)集Syn-TODD上的定量對比結果

wKgZO2fIJSyAF77cAACLqiDq9qc375.png

真實數(shù)據(jù)集ClearPose上的定量對比結果

從表格中的定量對比可以看出,MODEST算法框架在各項指標上都要大幅超過其他所有方法。值得注意的是,盡管只使用單張RGB圖像作為輸入,MODEST在深度估計和語義分割方面都要明顯優(yōu)于其他雙目甚至多視圖方法。并且在Syn-TODD數(shù)據(jù)集上,與排名第二的方法相比,MODEST算法框架在RMSE和REL兩項指標有著超過45%的提升,語義分割的精度也均超過了90%。

真實平臺抓取實驗

我們將算法遷移到真實機器人平臺,開展了透明物體抓取實驗。平臺主要由UR機械臂和深度相機構成,在借助MODEST方法進行透明物體精確感知的基礎之上,采用GraspNet進行抓取位姿的生成。在多個透明物體上的實驗結果表明,MODEST方法在真實平臺上具有良好的魯棒性泛化性。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    31407

    瀏覽量

    223569
  • 人工智能
    +關注

    關注

    1819

    文章

    50301

    瀏覽量

    266846
  • 檢測算法
    +關注

    關注

    0

    文章

    122

    瀏覽量

    25777
  • 地瓜機器人
    +關注

    關注

    1

    文章

    33

    瀏覽量

    424
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    機器人主控核心板米爾RK3576 + ROS2,NPU加速實現(xiàn)目標跟隨與機械臂抓取

    操作”——識別特定物體、主動跟隨、近距離抓取。本文將在此基礎上,集成深度攝像頭,實現(xiàn)機器人核心功能: 使用米爾RK3576 NPU加速MixFormerV2進行目標跟蹤,替代傳統(tǒng)OpenCV算法
    發(fā)表于 04-10 21:23

    工廠內物流機器人+無序抓取, 復合機器人機床上下料賦能智能制造升級

    ?一、智能制造風口下,三大核心技術重構工廠生產邏輯 當前制造業(yè)向柔性化、智能化轉型,工廠內物流機器人、無序抓取、復合機器人機床上下料已成為核心支撐技術。據(jù)百度SEO數(shù)據(jù)顯示,三者搜索量年增速均超35
    的頭像 發(fā)表于 03-13 16:14 ?222次閱讀

    世強硬創(chuàng)平臺榮獲地瓜機器人2025年度最佳代理商獎

    2026年1月,在地瓜機器人2025年度營銷總結會議上,世強硬創(chuàng)平臺再次被授予“2025最佳代理商獎”。這已是世強硬創(chuàng)連續(xù)第三年獲此殊榮,標志著雙方合作持續(xù)深化,并取得了扎實的商業(yè)成
    的頭像 發(fā)表于 02-06 18:02 ?2698次閱讀

    【案例分享】電子谷定制通訊線束:人形機器人穩(wěn)定律動連接方案

    人形機器人的精準抓取、復雜揮動等靈巧動作,離不開左手臂通訊線的極致穩(wěn)定傳輸。電子谷定制機器人左臂通訊線束——專為人形機器人量身打造,融合高密
    的頭像 發(fā)表于 01-10 08:32 ?579次閱讀
    【案例分享】電子谷定制通訊線束:人形<b class='flag-5'>機器人</b>穩(wěn)定律動連接<b class='flag-5'>方案</b>

    解鎖“試管自動抓取搬運”新紀元:富唯智能復合機器人重塑精準物流

    在工業(yè)自動化的浪潮中,如何高效、精準地完成如“試管自動抓取搬運”這類高要求的物料處理任務,成為許多行業(yè)邁向智能化升級的關鍵挑戰(zhàn)。富唯智能推出的復合機器人解決方案,正以其高度集成、靈活部
    的頭像 發(fā)表于 12-31 17:01 ?1435次閱讀
    解鎖“試管自動<b class='flag-5'>抓取</b>搬運”新紀元:富唯智能復合<b class='flag-5'>機器人</b>重塑精準物流

    如何使用機器人分析儀EtherCAT-Analyzer抓取主從站數(shù)據(jù)?

    EtherCAT總線在機器人控制總線里占據(jù)重要地位。這次,我們搭建了包含EtherCAT主從站和分析儀的完整環(huán)境,用機器人分析儀EtherCAT-Analyzer實際抓取主從站之間的通訊數(shù)據(jù)。實測
    的頭像 發(fā)表于 12-22 11:46 ?972次閱讀
    如何使用<b class='flag-5'>機器人</b>分析儀EtherCAT-Analyzer<b class='flag-5'>抓取</b>主從站數(shù)據(jù)?

    打造機器人母生態(tài)!一年開發(fā)者數(shù)量翻倍,地瓜機器人發(fā)布具身智能大算力開發(fā)平臺

    電子發(fā)燒友網報道(文/莫婷婷)2025年11月21日,在地瓜機器人舉辦的DDC2025開發(fā)者大會上,地瓜
    的頭像 發(fā)表于 11-27 09:16 ?8187次閱讀
    打造<b class='flag-5'>機器人</b>母生態(tài)!一年開發(fā)者數(shù)量翻倍,<b class='flag-5'>地瓜</b><b class='flag-5'>機器人</b>發(fā)布具身智能大算力開發(fā)平臺

    廣和通亮相DDC 2025地瓜機器人開發(fā)者大會

    11月21日,DDC2025地瓜機器人開發(fā)者大會在深圳順利舉行。大會匯聚來自機器人全產業(yè)鏈的技術團隊、生態(tài)伙伴與開發(fā)者,共同探討機器人技術的
    的頭像 發(fā)表于 11-26 15:49 ?588次閱讀
    廣和通亮相DDC <b class='flag-5'>2025</b><b class='flag-5'>地瓜</b><b class='flag-5'>機器人</b>開發(fā)者大會

    具身智能大算力開發(fā)平臺S600重磅亮相,地瓜機器人引領端云一體機器人進化新范式

    11月21日,以“無FUN不起浪”為主題的DDC2025地瓜機器人開發(fā)者大會在深圳成功舉辦。作為業(yè)界領先的機器人軟硬件通用底座提供商,地瓜
    發(fā)表于 11-21 22:21 ?1645次閱讀
    具身智能大算力開發(fā)平臺S600重磅亮相,<b class='flag-5'>地瓜</b><b class='flag-5'>機器人</b>引領端云一體<b class='flag-5'>機器人</b>進化新范式

    為什么2025機器人都在搶SH602HA-AP?

    11月20日,在DDC2025地瓜機器人開發(fā)者大會前夕,移遠通信正式發(fā)布搭載地瓜機器人旭日5智能計算芯片的SH602HA-AP
    的頭像 發(fā)表于 11-20 19:03 ?1940次閱讀
    為什么<b class='flag-5'>2025</b>年<b class='flag-5'>機器人</b>都在搶SH602HA-AP?

    力傳感器在工業(yè)自動化機器人中的應用:精確抓取/裝配作業(yè)/搬運作業(yè)/柔順控制

    具體應用 精確抓取: 在自動化生產線上,機器人需要精確抓取各種物品。力傳感器可以安裝在機器人的末端執(zhí)行器上,實時感知抓取
    的頭像 發(fā)表于 11-14 09:10 ?290次閱讀
    力傳感器在工業(yè)自動化<b class='flag-5'>機器人</b>中的應用:精確<b class='flag-5'>抓取</b>/裝配作業(yè)/搬運作業(yè)/柔順控制

    機器人競技幕后:磁傳感器芯片激活 “精準感知力”

    2025 世界人形機器人運動會于 8 月 17 日圓滿收官,賽場上機器人在跑步、跳躍、抓取等項目中的精彩表現(xiàn),背后是運動控制、環(huán)境感知等技術的迭代升級。而在這些技術中,磁傳感器芯片憑借
    發(fā)表于 08-26 10:02

    盤點#機器人開發(fā)平臺

    地瓜機器人RDK X5開發(fā)套件地瓜機器人RDK X5開發(fā)套件產品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網機器人開發(fā)套件 Kria KR
    發(fā)表于 05-13 15:02

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎算法的應用

    結合IMU(慣性測量單元)進行多傳感器融合。 三、總結與展望 技術融合趨勢 機器人視覺與SLAM的結合(如視覺慣性里程計VIO)是當前研究熱點,未來可能進一步結合語義SLAM,讓
    發(fā)表于 05-03 19:41

    大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產品

    全球80多個國家和地區(qū)。 近日,大象機器人聯(lián)合進迭時空推出全球首款RISC-V全棧開源六軸機器臂“myCobot 280 RISC-V”,為開發(fā)者打造全新的機器人開源創(chuàng)新平臺。 “my
    發(fā)表于 04-25 17:59
    格尔木市| 邵阳县| 朝阳市| 桑植县| 和政县| 凤山市| 天镇县| 鄱阳县| 万年县| 巫山县| 张家口市| 宝应县| 鄢陵县| 连平县| 永仁县| 怀集县| 临清市| 峡江县| 九台市| 涿州市| 平塘县| 溆浦县| 泰兴市| 康乐县| 措美县| 乐陵市| 卓资县| 乌兰县| 百色市| 克山县| 志丹县| 商丘市| 东丽区| 武胜县| 东辽县| 体育| 盐津县| 光泽县| 海淀区| 老河口市| 九台市|