预置数据集

「一站式开发平台」提供了多种公开数据集,支持图片、视频、文本、表格、音频、自定义等多种数据标注格式。预置数据集可以直观地呈现标注算法任务的效果。

预置数据集

名称数据类型标注类型说明
Caltech-256图片图像分类Caltech-256 是一个图像物体识别数据集,包含 29780 张图片,256 个物体类别。
COCO2017-train图片目标检测MS COCO 数据集训练集。 COCO 全称是 Common Objects in Context,是微软团队提供的一个大型的、丰富的目标检测、分割和识别的数据集。
COCO2017-val图片目标检测MS COCO 数据集验证集。
Data-Augment图片图像分类基于部分 O-HAZE 数据集和网络图片组成的内置数据增强算法的数据集(仅作功能示例)。
Object-Tracking视频目标跟踪基于「一站式开发平台」内置目标跟踪算法的数据集(仅作功能示例)。
NLP_IMDBtxt文本分类基于 IMDB 影评的文本数据集,分为 positive 和 negative

下载平台 预置数据集

其他数据集

名称数据类型标注类型说明
Semantic Segmentation图片语义分割对图像中每一个像素点进行分类,确定每个点的类别(如属于背景、人或车等),从而进行区域划分
Audio classification音频音频分类对音频按标签进行分类

模板下载

标注算法

算法名称算法描述是否需要 GPU所需环境
annotation自动标注算法,适用于图像分类、目标检测oneflow(0.3.4)、 python(>=3.7)
imagenet自动标注算法,使用于图像分类(其中标签组必须使用 ImageNet)oneflow(0.3.4)、python(>=3.7)
imgprocess数据增强算法python(>=3.5)
ofrecordOFRecord 转换算法oneflow(0.3.4)、 python(>=3.7)
text_classification文本分类oneflow(0.3.4)、python(>=3.7)
track目标跟踪算法python(>=3.5)
important
  1. OneFlow 是数据标注算法底层依赖的深度学习框架,详见 官网github 仓库
  2. 安装部署文档参考 部署数据处理算法

预置数据集效果

「预置数据集」是「一站式开发平台」提供的公共数据集模板,方便用户直观的查看数据处理后的效果:

图 1 预置数据集
图 1 预置数据集

1. 图像分类

「图像分类」预置数据集展示:

图 2 图像分类
图 2 图像分类

2. 目标检测

「目标检测」预置数据集展示:

图 3 目标检测
图 3 目标检测

3. 目标跟踪

「目标跟踪」预置数据集展示:

图 4 目标跟踪
图 4 目标跟踪

4. 语义分割

「语义分割」预置数据集展示:

图 5 语义分割
图 5 语义分割

5. 文本分类

「文本分类」预置数据集展示:

图 6 文本分类
图 6 文本分类

6. 实体命名识别

「实体命名识别」预置数据集展示:

图 7 实体命名识别
图 7 实体命名识别

7. 中文分词

「中文分词」预置数据集展示:

图 8 中文分词
图 8 中文分词

8. 音频分类

「音频分类」预置数据集展示:

图 9 音频分类
图 9 音频分类

9. 自定义

「自定义」数据集展示:

图 10 自定义
图 10 自定义

10. 数据增强

「数据增强」效果对比:

图 11 数据增强
图 11 数据增强
Last updated on