机器人抓取中物体定位算法概述

本文探讨了机器人抓取中物体定位的关键技术,包括定位但不识别、目标检测和物体实例分割。介绍了2D RGB图像和3D点云方法,如形状基元拟合、显著性区域检测、2D/3D目标检测和实例分割算法。这些方法在不同的信息条件下,帮助机器人确定目标物体的位置和类别,为后续抓取操作提供支持。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文同步于微信公众号:3D视觉前沿,欢迎大家关注。

1. 引言

机器人抓取的首要任务,是确定要抓什么,也就是需要定位目标物体在输入数据中的位置。这个过程可以分为三个层次,分别为物体定位但不识别、物体检测、物体实例分割。物体定位但不识别是指获得目标物体的2D/3D范围但是不知道物体的类别;目标检测是指得到目标物体的2D/3D包围盒,同时识别目标物体的类别;目标实例分割提供目标物体所占有的像素或者点级别的区域信息,同时识别目标物体的类别。本文来自论文https://arxiv.org/abs/1905.06658,涉及的论文也都可以在论文中找到,也包含于https://github.com/GeorgeDu/vision-based-robotic-grasping,本文就不引用了。

2. 定位但不识别

当不知道目标物体的类别时,仍然可以采用一些方法获得目标物体的2D/3D区域,进而支撑机器人抓取。当我们知道物体的外轮廓形状时,可以采用拟合形状基元的方法。当我们什么信息都没有时,可以采用显著性物体检测方法,获得潜在可能的待抓取物体区域。

2.1 基于2D RGB图像的方法

在这里插入图片描述
图1 基于2D图像的定位但不识别方法

a.拟合形状基元: 目标物体的形状可以是一个椭圆、一个多边形或者一个四边形,这些2D形状可以看作是形状基元,通过拟合方法,可以定位到目标物体。该方法的一般步骤为先提取出图像的所有封闭轮廓,其次再用拟合方法得到潜在的可能目标物体,如果存在多个候选,可以使用模板匹配去除干扰。在OpenCV中已经集成了例如拟合椭圆、拟合多边形这样的函数。

b.显著性区域检测: 和特定形状基元相比,显著性区域可以是任意形状。2D显著性区域检测的目的是定位和分割出给定图像中,最符合视觉显著性的区域,这更像一个分割任务。非深度学习的方法主要挖掘低层次的特征表示,或者依据一些经验例如颜色对比、形状先验来得到显著性区域。基于深度学习的方法主要包括基于多层感知机(MLP)的方法,基于全卷积网络(FCN)的方法和基于胶囊网络的方法。

在目前的机器人抓取任务中,该方法仍处在初级阶段。在工业领域,如果待抓取物体形状固定且轮廓清晰,可以采用拟合形状基元的方法。在另外一些机器人抓取任务中,如果背景的颜色信息和目标物体的颜色信息差别较大,也可以去除背景得到目标物体。在Dex-Net2.0中,目标物体放置在绿色背景的桌面上,通过背景颜色分离,可以得到目标物体。

2.2 基于3D点云的方法

在这里插入图片描述
图2 基于3D点云的定位但不识别方法

a.拟合3D形状基元: 目标物体的形状可以是一个球体、圆柱体或者长方体,这些3D形状可以看作是3D形状基元。存在很多方法能够拟合,包括随机采样点一致(RANSAC)算法,基于霍夫投

在 Code::Blocks 中,C 语言程序输出乱码的原因可能有以下几种情况: 1. 使用了错误的字符编码:确保程序文件使用的字符编码与你的操作系统和终端的字符编码一致。一般情况下,UTF-8 是一个通用的编码格式,可以尝试在程序中使用该编码。 2. 使用了错误的输出函数:在 C 语言中,输出函数有多种,如 printf、puts、fputs 等,每个函数的使用方式和输出结果略有不同,需要根据具体的需求进行选择。 3. 终端字符编码设置错误:如果程序输出到终端,那么终端的字符编码也需要正确设置。在 Windows 系统下,可以使用 chcp 命令来设置终端的字符编码;在 Linux 和 macOS 系统下,可以使用 locale 命令来设置终端的字符编码。 4. 程序中存在中文字符:如果程序中存在中文字符,需要在程序中添加 #pragma execution_character_set("utf-8") 或者 #pragma execution_character_set("gbk") 等语句来设置字符编码。 如果以上方法都不起作用,可以尝试在程序中使用 Unicode 编码,并将输出转换成 UTF-8 或者 GBK 编码。可以使用如下代码来进行转换: ```c #include <locale.h> #include <wchar.h> #include <stdlib.h> void unicode_to_utf8(wchar_t *in, char *out, size_t len) { setlocale(LC_ALL, "en_US.utf8"); wcstombs(out, in, len); } void unicode_to_gbk(wchar_t *in, char *out, size_t len) { setlocale(LC_ALL, "zh_CN.gbk"); wcstombs(out, in, len); } ``` 使用上述代码,可以将 Unicode 编码的字符串转换成 UTF-8 或者 GBK 编码,然后再进行输出。
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值