专栏名称: 我爱计算机视觉
关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net 微博:计算机视觉与机器学习,QQ群:928997753,52CV君个人账号:Your-Word。
目录
相关文章推荐
中国航务周刊  ·  【年报】中国港口发展2024年回顾与2025年展望 ·  2 天前  
中国航务周刊  ·  【展商推介】上华国际,邀您莅临“2025国际 ... ·  4 天前  
中国航务周刊  ·  【货主论坛】“2025跨境冷链与国际贸易协同 ... ·  3 天前  
51好读  ›  专栏  ›  我爱计算机视觉

从LabelMe到一键Label All! 8 款数据标注工具真实试用推荐

我爱计算机视觉  · 公众号  ·  · 2024-09-10 15:15

主要观点总结

文章介绍了2024年新兴及经典的数据标注工具,包括LabelMe、Make Sense、T-Rex Label、VoTT、LabelU、Label Studio、Supervisely和Labelbox等。这些工具支持不同的标注类型,如多边形、矩形、圆形等,并具有不同的特性,如支持多种格式导入导出、集成AI模型进行自动标注等。文章对这些工具进行了简要描述,包括其特点、价格及网址。

关键观点总结

关键观点1: 数据标注工具的重要性

数据标注是机器学习的重要环节,这些工具可以帮助用户更有效地进行数据采集和标注。

关键观点2: 新兴工具与经典工具的比较

新兴工具具有更现代化的交互界面和更强大的模型能力,而经典工具则具有稳定性和广泛的应用。用户可以根据需求选择合适的工具。

关键观点3: 工具的多样性和选择

文章介绍了多个数据标注工具,包括它们的特性、价格和网址。用户可以根据需求选择合适的工具,这些工具支持不同的标注类型和项目需求。


正文




关注公众号,发现CV技术之美




AI 技术的浪潮一浪高过一浪,数据标注工具也在这波涛汹涌中不断升级换代。在数字化的海洋里,精准且高质量的数据集就像是宝藏,是打造超级智能AI模型的黄金钥匙。而选对数据标注工具,就好比是找到了打开AI宝库的钥匙。

说到数据标注界的元老级人物,LabelMe 和Label Studio 这些大佬们依然仍屹立不倒。但“江山代有才人出”,一波又一波的新兴工具也不断涌现。带着更酷炫的交互界面和更牛掰的模型能力,像一匹匹黑马,引领着行业的新潮流。接下来一起盘点 2024 年那些强得可怕的数据标注工具。


1.LabelMe

LabelMe 最早是由麻省理工学院 (MIT) 的计算机科学与人工智能实验室 (CSAIL) 于 2008 年发布的,类型覆盖了实例分割、语义分割、bbox标注、图片分类等,是标注领域中不得不提的元老。

时至2024年8月,LabelMe 也不出意外的进入了商业化,发布了新版官网,集成了SAM、YOLO-World等模型,支持本地安装,但这些功能主要在Pro版本,入门版还是手动标注为主。

工具特性:

  • 支持 Windows、macOS 和 Linux 系统本地安装
  • 入门版支持多边形、矩形、圆形、直线、点、线带等不同标注类型
  • Pro 版本提供 Python API ,可通过编程的方式自动化标注流程、批量处理标注数据、或将标注结果转换为其他格式

价格:基础功能免费,Pro 版(包含AI标注、数据管理等功能)27美元

网址:https://www.labelme.io/


2.Make Sense

Make Sense 是一款在线标注工具,于 2019 年发布。Make Sense 显著的优势是轻量化和清晰化,相比于 LabelMe 的传统 UI 界面,使用体验显著提升。支持常见格式的导入、导出。

值得一提的是, Make Sense 受到了 YOLOv5 和 Roboflow 的官方推荐。Make Sense 基于 Typescript 开发,同时有开源版本,但代码近两年没有更新,社区问题的响应率比较低。

工具特性:

  • 无需部署或进行环境配置,浏览器打开即可标注
  • 支持矩形、线条、点和多边形等标签类型
  • 输出文件格式包括YOLO、VOCXML、VGG、JSON、CSV
  • 接入 AI 模型(内置了 YOLOv5、COCO SSD 和 Pose-Net )可进行自动标注

价格:免费

网址:https://www.makesense.ai/


3.T-Rex Label

T-Rex Label 是IDEA研究院(发布开集检测模型 Grounding DINO、T-Rex2 的团队)2024年最新发布的标注工具。不同于预训练模型辅助的 AI 标注(Make Sense),或者基于文本提示的智能标注(LabelMe Pro),T-Rex Label 是使用了一种视觉提示的标注方式。

框选任意目标,就可以标注其他相似物体的bbox,这种方式对于难以用文本描述的物体标注尤为适用 。T-Rex Label 的标注交互流畅,社区反馈的相关问题响应较快。

工具特性:

  • 基于视觉提示的Bbox自动标注
  • 无需下载安装, 支持 Github 登录
  • 支持导出为 COCO、YOLO 等主流格式

价格:免费

网址:https://trexlabel.com/


4.VoTT

VoTT(Visual Object Tagging Tool)是由微软开发的一款图像和视频标注工具,于2018 年发布。

目前 VoTT 的最新版本是 V2,使用 TypeScript 编写。VoTT 主攻图像和视频帧的标注,进入工具后能感受到界面简单直观,功能模块清晰。VoTT 也支持与预训练模型的集成,自动生成标注,很适合大规模数据集的处理。

VoTT 平台可以与多种数据源连接,包括本地文件系统和云存储,同时还支持自定义导入导出策略。

工具特性:

  • 支持 Windows、macOS 和 Linux 操作系统
  • 主要是矩形和多边形标注
  • 支持集成多种机器学习模型和框架,但有一些成本
  • 导出数据支持多种格式,如CSV、CNTK、TensorFlow 以及自定义JSON

价格:免费

网址:https://github.com/microsoft/VoTT


5.LabelU

LabelU 是一款综合性轻量级的标注工具,由 OpenDataLab 开发今年上半年推出。LabelU的优势是工具类型全面,甚至包括属性、立体框等工具,适合构建复杂的标注任务,建自己需求的标注界面。

LabelU 目前没有集成智能标注的功能,但支持预标注数据的一键载入,用户可以根据实际需要对其进行细化和调整。

工具特性:

  • 提供包括2D框、3D框、多边形、点、线等多种标注方式
  • 支持图像、视频和音频等类型的数据标注
  • 支持预标注数据的一键载入,进行细化和调整标注后的结果可一键导出
  • 目前支持JSON、COCO、MASK等导出格式

价格:免费

网址:https://github.com/opendatalab/labelU


6.Label Studio

Label Studio 相信都不陌生,由 Heartex 基于 Python 语言开发,于2019年推出,是一个全面强大的数据标注平台。在 Label Studio 中,可以根据项目需求自定义标注界面、调整标注工具,设置好后使用起来很顺手。

值得一提的是,Label Studio 提供了内置的质量控制机制,如标注审核和多标注员一致性检查,以确保标注数据的准确性和可靠性。

工具特性:

  • 支持本地部署和云部署,适应不同规模的团队和项目
  • 可通过编写 YAML 文件自定义标注界面
  • 支持与多种机器学习框架如 TensorFlow、PyTorch、scikit-learn 集成
  • 支持多种标注类型,包括图像、文本、音频、视频以及时间序列

价格:普通版免费,企业版详询官网

网址:https://labelstud.io


7.Supervisely

Supervisely 是一款基于 web 的数据标注平台,同样具有直观易用的 UI 设计。此外,Supervisely 更是一款名副其实的端到端数据标注和管理平台,可以在该平台上实现数据管理、自动化标注和团队协作的全流程功能。

企业版还支持本地部署和 Python 应用程序自定义标注工作流,尤其适合需要进行大规模数据处理和数据类型复杂多样的项目团队。

工具特性:







请到「今天看啥」查看全文