【idx是什么意思啊 idx是什么文件】AI 支持使用 makesense.ai 进行标记
工作完成后,我们可以下载一个 .zip 文件,其中包含 .txt 文件 。每一个这样的文件都对应于一个标记的图像,并描述照片中可见的对象 。如果我们打开其中一个文件,我们会发现,每一行都是 class_idx x_center y_center width height 式 。其中 class_idx 表示 class_names.txt 文件中指定标签的索引(从 0 开始计数) 。其余参数描述围绕单个对象的边界框,它们可以取 0 到 1 之间的值 。幸运的是,大多数时候我们不需要考虑这些细节,因为编辑器会为我们处理所有的事情 。YOLO 格式的标签示例如下所示 。
环境设置
YOLO 最初是在一个叫做 Darknet 的深度学习的小框架中写的 。从那时起,许多其它实现已经创建,其中大多数使用两个非常流行的 Python 平台:Keras 和 PyTorch 。在所有可用的解决方案中,有一个是我特别喜欢的(https://github.com/ultralytics/yolov3) 。它提供了一个用于训练和检测的高级 API,但也具有很多有用的特性 。在使用它时,我们的所有工作归结为准备一个数据集和创建几个配置文件,然后其余的工作就交给库了 。
环境设置也非常简单——可以归结为运行几个命令,你可以在下面找到这些命令(假设你的计算机上已经安装了 Python 和 Git) 。最好从项目目录中执行命令,以实现上面所示的结构 。值得一提的是,环境也可以通过 Docker 创建(这对 Windows 用户特别有用) 。你可以在这里(https://github.com/ultralytics/yolov3/wiki/Docker-Quickstart)找到更多关于这个主题的说明 。
# Clone framework
git clone https://github.com/ultralytics/yolov3.git
# Enter framework catalogue [Linux/MacOS]
cd ./yolov3
# Setup Python environment
pip install -U -r requirements.txt
配置
如前一段所述,我们现在需要做的就是创建几个配置文件 。它们定义了训练集和测试集的位置、对象类的名称,并提供了所用神经网络的架构指南 。
国际象棋数据集标注参考图片
首先,我们需要将数据集分割成训练集和测试集 。我们使用两个 .txt 文件来完成这项工作,它们中的每一个都包含指向数据集中特定图像的路径 。为了加快工作速度,我准备了一个 Python 脚本,它将自动为我们创建这些文件 。你只需指示数据集的位置并定义训练集和测试集之间的分割百分比 。train.txt/test.txt 文件的片段如下所示 。
./dataset/images/image_1.png
./dataset/images/image_2.png
./dataset/images/image_3.png
...
.data 是我们需要提供的最终文件 。让我们用下一个项目的例子来讨论它的内容——象棋检测器 。在本例中,我有 12 个惟一的对象类想要识别 。接下来,我们给出定义哪些照片属于训练集,哪些照片属于测试集的文件的位置,最后给出前面讨论的带有标签名称的文件的位置 。为了使一切正常工作,chess.data、chess_train.txt、chess_test.txt 和 chess.names 文件应移动到 project/yolov3/data 目录 。
classes=12
train=./data/chess_train.txt
valid=./data/chess_test.txt
names=./data/chess.names
训练
现在我们准备开始训练 。如前所述,我们使用的库有一个高级 API,因此终端中的一个命令和几个参数就足以启动这个过程 。然而,在下面还有几件大大增加我们取得最终成功的几率的事情 。
python3 train.py
--data ./data/project.data
--cfg ./cf百思特网g/project.cfg
--weights ./weights/yolov3.pt
首先,我们可以应用迁移学习,我们不必从头开始训练 。我们可以使用在不同数据集上训练的模型的权重,从而缩短我们自己的网络的学习时间 。我们的模型可以使用基本的形状知识,并专注于将这些信息链接到我们想要识别的新类型的对象 。其次,库执行数据增强,因此它根据我们提供的照片生成新的示例 。因此,即使我们只有一个很小的数据集——几百张图片,我们也可以训练我们的模型 。我们使用的库还为我们提供了一个由于增强而创建的图像示例 。下面你可以看到在我的篮球探测器的训练过程中创建的示例 。
推荐阅读
- 口水鸡是哪个地方的菜系 口水鸡是哪里的菜
- 治理雾霾的方法与措施 治理雾霾的方法
- 贸易顺差计算公式 贸易顺差是什么意思
- 每一部都是经典 最新电视剧2022热播最火剧
- 开天眼的人能看见什么?开天眼究竟是怎样的神通
- 吴京和吴越是什么关系?吴樾是吴京的师兄吗
- 何捷与韩雪之间的关系
- “嗨害嗨”到底是什么意思? 嗨嗨嗨是什么梗
- 昆凌三胎后高调复出 昆凌个人简历
