创建数据集

操作步骤

  1. 左侧菜单栏中选择 「数据管理」> 「数据集管理」,进入数据集管理页面
  2. 点击「创建数据集」按钮,输入数据集名称、选择数据类型和标注类型
图 1 创建数据集
图 1 创建数据集
表1 数据类型和标注类型的关系说明

数据类型标注类型使用说明
图片图像分类对图片按标签进行分类
图片目标检测检测图片中多个目标
图片语义分割对图像中每一个像素点进行分类,确定每个点的类别(如属于背景、人或车等),从而进行区域划分
视频目标跟踪对视频采样后进行跟踪视频序列中的目标位置、信息
文本文本分类对文本按标签进行分类,表格最后还是转化为文本
文本中文分词将连续的字序列按照一定的规范重新组合成词序列的过程,表格最后还是转化为文本
文本命名实体识别识别文本中具有特定意义的实体,表格最后还是转化为文本
音频音频分类对音频按标签进行分类
音频语音识别指将人类语音中的词汇内容转换为计算机可读的输入
自定义-导入自定义数据集

目前智能标注只支持预置标签,用户自定义标签需要单独实现

3. 选择标签组

  • 标签组分为「自定义标签组」和「预置标签组」,在创建数据集时选择;中文分词、音频识别、自定义数据集不需要选择标签组
  • 「自定义标签组」是用户创建的标签组,需要提前在标签组管理页面中创建
  • 「预置标签组」是系统内置的标签组,无需创建,支持自动标注。其中,COCO 是微软团队提供的一个用来进行目标检测的数据集,ImageNet 是根据 WordNet 层次结构组织的图像分类数据集
图 2 选择标签组
图 2 选择标签组

4. 完成创建

点击「确定」,创建数据集成功

图 3 完成数据集创建
图 3 完成数据集创建

5. 导入文件

点击「导入」上传文件或在查看详情里添加文件文件

图 4 导入文件
图 4 导入文件
Last updated on