PS:建议 180% 以上倍率查看 README.pdf,否则可能导致某些图像边缘坐标信息的丢失,可以通过书签页迅速跳转查看各章节。
-
航速:拖网最高($2<v<6$),其次为刺网($1<v<2$),最低为张网($0<v<1$)。浙江数字渔场建设工作方案(36所建议稿)给出的各类型渔船航速的数据显示,总体速度波动较大,但基本都存在一个稳定的作业速度,所以可以先对速度检测曲线进行类似下图的平滑处理,减少速度曲线的波动。
-
航向(轨迹图):经过观察分析发现各类型渔船的航向图有着各自类型独有的特点,比如拖网航向变化很频繁,轨迹图形成多个集中的区域;张网的航向变化很少,轨迹图多为直线;刺网兼有拖网及张网的特点,需要预处理后才能区分。可以尝试通过卷积神经网络对航向图像进行分类处理(已画出所有拖网船型的轨迹图,无明显可区分特征,未经预处理不适合卷积神经网络直接分类)。
-
航速比:相同类型船只的航速比去除掉一些奇异点之后的直方图拟合曲线具有一定的相似性,具有较强的可区分特征。可以尝试用卷积神经网络做分类(航速比直方图拟合曲线图多为背景信息,图像信息较少,可能结果不是很好,作为第二方案)。
-
航速变化率及航向变化率:可以尝试将航速变化率及航向变化划分为几个区域,然后在这些区域内提取不同的统计学特征用来表征这个类型的船只,关键点在于如何选择合适的区域使得提取的特征具有可区分性。
-
**拖网类型船只的总样本数(船号数)为
445
**,总的数据组数为17,730,700
,其中船号为47292
的拖网渔船拥有最少记录数据20,922
组,拥有最多记录数据的船号为50029
,包含63,356
组:船号 数据总数(组) 47292(最少数据) 20,922 50029(最多数据) 63,356 所有拖网船只 17,730,700 其中,船号31436,第3411、3412航速数据错误。
-
**拖网数据特点:**航速在
$v=0$ 及$v=2$ 附近的权重较大,这点与其它两种类型的船只差别较大,因而该航速比直方图特征可直接作为部分的拖网船型的特征(为防止可能存在的错误航速数据的影响,设定航速最大值$v_{max}=25$ ,然后归一化处理)。 -
通过先对经、纬度坐标信息做降维去相关处理,然后可以得到每条渔船的
$1 \times N$ 维的特征,随后通过对特征固定数量的采样确保每条渔船的特征维数(暂时取1000
维)都相同。 -
接着使用主成分分析法从这些
1000
维特征中提取出$M$ 维的特征向量(暂时先取35
维)并做归一化处理,最后将该特征与速占比特征(100
维)结合得到该条渔船最终的特征(135
维)。 -
下图是前两条拖网渔船的最终特征(Intel(R) Xeon(R) CPU @ 2.30GHz下,该类型所有船只的特征提取总耗时约
1511
秒)。
-
**张网类型船只的总样本数(船号数)为
77
**,总的数据组数为2,875,900
,其中船号为35234
的张网渔船拥有最少记录数据20,557
组,拥有最多记录数据的船号为55430
,包含57,307
组:船号 数据数(组) 35234(最少数据) 20,557 55430(最多数据) 57,307 所有张网船只 2,875,900 -
**张网数据特点:**航速在
$0<v<2$ 之间分布较多,这点与刺网相似,但是张网的航线轨迹图的 目标地点 更加的明确,侧面反映该类渔船的航向变化不是很频繁,这点与其它两种类型 9263 船只差别较大。 -
通过与拖网渔船相同的操作,可以得到该条张网渔船的采样特征。该特征与其它两类船型有着明显的差异性,在一定区域内较为平稳,且有着近似周期的性质。
-
前两条张网渔船的最终
135
维特征(该类型所有船只的特征提取总耗时约243
秒)。
-
**刺网类型船只的总样本数(船号数)为
173
**,总的数据组数为8,481,908
,其中船号为52251
的刺网渔船拥有最少记录数据25,871
组,拥有最多记录数据的船号为28824
,包含63,410
组:船号 数据数(组) 52251(最少数据) 25,871 28824(最多数据) 63,410 所有刺网船只 8,481,908 -
**刺网数据特点:**速度直方图分布与张网类型的船只很像,在航线轨迹图上与拖网十分的相似(都在频繁的改变航向)。
-
通过同样的数据预处理操作,可以得到该条刺网渔船的采样特征。该采样特征与其它两类船型的采样特征相比,波动性很明显,是非常好的可区分特征。
-
前两条刺网渔船的最终
135
维特征(该类型所有船只的特征提取总耗时约710
秒)。
对上述提取的特征采用包含 2
个隐层的神经网络做分类,网络结构如下所示:
对 3
种类型共 695
条渔船做分类识别,结果如下所示:
Epoch 1, cross_entropy: 0.8688, accuracy: 64.84%.
Epoch 10, cross_entropy: 0.2746, accuracy: 89.84%.
Epoch 20, cross_entropy: 0.1436, accuracy: 94.53%.
Epoch 30, cross_entropy: 0.0974, accuracy: 97.66%.
Epoch 40, cross_entropy: 0.0647, accuracy: 98.44%.
Epoch 50, cross_entropy: 0.0174, accuracy: 100.00%.
Epoch 60, cross_entropy: 0.0215, accuracy: 100.00%.
Epoch 70, cross_entropy: 0.0161, accuracy: 99.22%.
Epoch 80, cross_entropy: 0.0323, accuracy: 99.22%.
Epoch 90, cross_entropy: 0.0462, accuracy: 98.44%.
Epoch 100, cross_entropy: 0.0179, accuracy: 100.00%.
Epoch 110, cross_entropy: 0.0072, accuracy: 100.00%.
Epoch 120, cross_entropy: 0.0125, accuracy: 100.00%.
Epoch 130, cross_entropy: 0.0077, accuracy: 100.00%.
Epoch 140, cross_entropy: 0.0119, accuracy: 100.00%.
Epoch 150, cross_entropy: 0.0078, accuracy: 100.00%.
Training completed.
Cross_entropy on the whole training set: 0.0034, accuracy: 100.00%.
通过 Tensorboard
进行可视化处理后得到识别精度随迭代次数的变化(由于尚未对特征参数及网络结构优化,所以训练后期仍存在 0.5%
的较小精度波动):
以及交叉熵损失随迭代次数的变化:
脚注 (Footnote)
[1]: Othmani M, Khlifi Y. 3D Object Model Reconstruction Based on Polywogs Wavelet Network Parametrization[J]. World Academy of Science, Engineering and Technology, International Journal of Computer, Electrical, Automation, Control and Information Engineering, 2016, 10(7): 1289-1294.