RVS AI训练失败怎么办?

原因及解决办法

常见的 RVS 训练失败总结及解决办法如下:

1.请检查 NIVDIA 独立显卡是否正常运行。

2.出现“ CUDA out of memory “的报错。

Python_AITrain_log

解决方案:

可以调整算子参数,可降低 batch_size 或者降低 img_size 。

3.初次训练需要联网下载预训练的权重文件,可能是网络异常导致下载失败。

解决方案:

可进行如下检查:Linux 版本在根目录下搜索 model_final_f10217.pkl.lock 文件(Windows 版本在 C 盘目录下搜索该文件),检查该文件所在目录是否有 model_final_f10217.pkl 文件。如果没有 model_final_f10217.pkl 文件,可从 RVS 安装目录下的 rvs_sdk 文件夹内找到 model_final_f10217.pkl 文件,将该文件复制到 model_final_f10217.pkl.lock 文件所在目录下。再次进行训练即可。