基于语义一致性约束与局部-全局感知的多模态3D视觉定位

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：3D多模态数据稀缺，使得传统方法进行监督训练时文本与视觉特征缺乏语义一致性。同时传统方法还易忽视局部关系与全局信息，从而导致性能不佳。针对上述问题，提出了一种基于语义一致性约束与局部-全局感知的多模态3D视觉定位方法。首先，该方法通过蒸馏2D预训练视觉语言模型知识，帮助3D模型提取到点云-文本语义一致性特征；其次设计了局部-全局感知模块，不断补充增强候选目标特征，以更精确匹配目标。（剩余16357字）

试读结束

购买全文6.00元下一篇一种在线更新的单目视觉里程计

计算机应用研究

2024年07期

¥12.00/本