基于大数据的特征趋势统计系统设计
打开文本图片集
摘 要: 基于RFID技术的船舶交通流统计系统进行特征趋势统计时未采用大数据技术,提取的特征数据不精确,增加特征统计的难度,导致船舶交通流特征统计效率较低。因此设计基于大数据的船舶交通流特征趋势统计系统,通过用户管理模块进入系统,采用Excel格式对数据实施输入与输出操作,通过海事子模块、港口子模块以及船舶子模块实现宏观特征分布统计与微观特征条件查询;软件部分通过数据处理、数据拟合以及拟合优化检验获取最优拟合函数,分析船舶交通流的特征趋势。实验结果表明,所设计系统能够准确统计船舶交通流特征趋势,具有效率高的优势。
关键词: 大数据; 海事子模块; 港口子模块; 拟合函数; 特征趋势; 统计系统
中图分类号: TN973.1⁃34; TP274.2 文献标识码: A 文章编号: 1004⁃373X(2018)22⁃0166⁃04
Abstract: The big data technology is not adopted for feature tendency statistics in the RFID technology based ship traffic flow statistical system, as a result, the extracted feature data is inaccurate, and the feature statistic difficulty is increased, which leads to the low statistical efficiency of ship traffic flow features. Therefore, a ship traffic flow feature tendency statistical system based on big data is designed. After entering the system from the user management module, input and output operations of data are implemented in the Excel format. The maritime sub⁃module, port sub⁃module and ship sub⁃module are used to obtain distribution statistics of macro features and realize condition query of micro features. In the software part, the optimal fitting function is obtained by means of data processing, data fitting and fitting optimization detection, so as to analyze the feature tendency of ship traffic flow. The experimental results show that the designed system can obtain accurate ship traffic flow feature tendency statistics, and has the advantage of high efficiency.
Keywords: big data; maritime sub?module; port sub⁃module; fitting function; feature tendency; statistical system
0 引 言
伴随海上交通运输业兴起,海上船舶交通流规模迅速扩大,各种特征趋势繁琐复杂,严重威胁航道安全、降低海上运输效率,因此确保海上船舶交通流安全、有序调度十分关键[1]。传统基于RFID技术的船舶交通流统计系统进行特征趋势统计时未采用大数据技术,提取的特征数据不精确,增加特征统计的难度,导致船舶交通流特征统计效率较低。现有研究表明,大数据技术被广泛应用在船舶交通流特征趋势研究方面,可以从海量数据信息中获取有效的特征分析数据[2]。从该角度出发,本文设计基于大数据的船舶交通流特征趋势统计系统,弥补传统系统统计性能差的缺陷,实现海上交通航道安全、有序运行。
1 船舶交通流特征趋势统计系统设计
1.1 系统硬件设计
本文基于海事主管机关、港口部门以及船舶公司的各自需求设计基于大数据的船舶交通流特征趋势统计系统。该系统硬件功能模块构成图如图1所示。
1.1.1 用户管理模块设计
用户进入本文设计的系统,选择符合自身需求的子系统,接着输入正确的登录信息,正式进入符合需求的子系统。
1.1.2 数据输入输出模块设计
系统采用Excel格式对数据实施输入与输出操作,采用在登录界面设置数据输入接口的方式,将船舶交通流大数据输入到所构建的数据库[3];采用在子系统设置数据输出接口的方式,实现条件查询结果、分布统计结果的输出。
1.1.3 海事子模块设计
船舶交通流某个特征的条件查询、某个特征或多个特征排列统计可通过海事子模块完成。
1) 条件查询功能。海事子系统可根据船舶的微观特征实施查询,同时存储查询结果[4];以数据统计的方式保存海上船舶交通流的特征。
2) 排列统计。船舶交通中船舶相关参数的排列统计可通过海事子系统进行获取,可得到图形化显示结果同时实施存储。
3) 船舶流量及组成统计。发挥海事子系统的功能,可以实现交通流数据中的交通流量、船舶种类、船舶尺寸等数据的统计[5]。
1.1.4 港口子模块设计
按条件查询与港口交通流特征的统计可通过港口子模块进行获取。港口子模块功能设计如图2所示。
1.1.5 船舶子模块设计
基于船舶的某个微观特征能够查询其他微观特征,同时存储查询结果,这是船舶子模块的主要功能[6]。该模块只能对船舶的静态特征实施查询。由于船舶的静态特征不随时空条件转换而改变[7],随机输入一个参数,即可获取对应的全部特征值。
1.2 系统软件设计
通过数据处理、数据拟合及优化检验和确定最优拟合函数等过程[8],实现基于大数据的船舶交通流特征趋势统计,进而完成系统的软件设计。具体过程如下所述。
基于上述方法得出船舶交通流特征的最优拟合曲线,则船舶交通流的特征值可通过拟合曲线、拟合分布函数特征进行获取[10],分析其函数特征得出船舶交通流的特征趋势,进而完成系统软件的设计。
2 实验分析
为验证本文系统在船舶交通流特征趋势统计方面具有优势,对天津海事局提供的天津港2009年船舶交通流数据信息展开实验分析。该数据相对来说比较全面、内容丰富,用来验证本文系统性能具有说服力。该实验数据以Excel形式存储,共包含23 257艘次。
实验从精确度、效率两方面验证本文系统对于船舶交通流特征趋势统计的性能,采用本文系统对天津港2007年1—8月份的船舶到港数据进行处理,获取的结果如表1所示。
分析表1能够看出,本文系统能够对船舶交通流数据进行精确处理,且将上述结果与真实数据进行对比,结果基本吻合,说明本文系统可用于船舶交通流特征趋势的统计。为进一步验证本文系统的优越性,引入基于AIS的船舶交通流统计系统、基于RFID技术的船舶交通流统计系统进行精确度、效率对比实验。三种系统获取的统计精确度对比结果如图3所示,统计效率曲线对比如图4所示。
分析图3可知,本文系统对5个月份的船舶交通流数据进行特征趋势统计实验获取的精确度较高,均在99%以上,与真实情况基本吻合。实验结果表明,本文系统进行船舶交通流特征趋势统计精确度高达99.8%,相较其他系统而言,具有精确度高的优势。
设计基于大数据的船舶特征趋势统计系统,能够准确、高效地对船舶交通流特征进行统计,为海上交通流特征趋势统计提供有效的手段,对于提高海上船舶运输效率、维护海上交通秩序、保障船舶安全运行具有积极作用。参考文献
[1] 刘军华.大数据视野下统计数据质量演变的信息回归、分布与趋势[J].统计与信息论坛,2015,30(9):7⁃11.
LIU Junhua. Information regression, distribution and trend of statistical data quality evolution in the perspective of big data [J]. Statistics & information forum, 2015, 30(9): 7⁃11.
[2] 肖润谋,李彬,陈荫三.基于大数据的高速公路运输趋势分析[J].交通运输工程学报,2015,15(5):85⁃90.
XIAO Runmou, LI Bin, CHEN Yinsan. Trend analysis of expressway transportation based on big data [J]. Journal of traffic and transportation engineering, 2015, 15(5): 85⁃90.
[3] 曹麦,倪苹,顾杰.京张高速公路大数据的统计分析[J].调研世界,2016(12):50⁃52.
CAO Mai, NI Ping, GU Jie. Big data statistical analysis of Beijing⁃Zhangjiakou expressway [J]. The world of survey and research, 2016(12): 50⁃52.
[4] 薛振宇,胡航海,宋毅,等.基于大数据分析的县公司综合评价策略[J].电力自动化设备,2017,37(9):199⁃204.
XUE Zhenyu, HU Hanghai, SONG Yi, et al. Comprehensive evaluation based on big data analysis for county electric power company [J]. Electric power automation equipment, 2017, 37(9): 199⁃204.
[5] 孟东霞,陈刚,许美玲.基于电信大数据的流动人口数据特征分析[J].中国新通信,2016,18(19):109.
MENG Dongxia, CHEN Gang, XU Meiling. Data feature analysis of migrant population based on big data of telecommunication [J]. China new telecommunications, 2016, 18(19): 109.
[6] 李金昌.基于大数据思维的统计学若干理论问题[J].统计研究,2016,33(11):3⁃10.
LI Jinchang. Several theoretical problems in statistics based on the idea of big data [J]. Statistical research, 2016, 33(11): 3⁃10.
[7] CHIAKI K, YOSHIO S, NORIYUKI K, et al. Cerebral data analysis system for large scale numerical simulation of nuclear power plant [EB/OL]. [2007⁃11⁃25]. http://jolissrch⁃inter.tokai⁃sc.jaea.go.jp/search/servlet/search?5008699&language=1.
[8] 罗繁明,杨海深.大数据时代基于统计特征的情报关键词提取方法[J].情报资料工作,2013,34(3):64⁃68.
LUO Fanming, YANG Haishen. On the statistical features⁃based information keyword extraction method in the era of big data [J]. Information and documentation services, 2013, 34(3): 64⁃68.
[9] 胡巧玲,茹金平.基于大数据分析的人口迁移量预测模型仿真[J].计算机仿真,2014,31(10):246⁃249.
HU Qiaoling, RU Jinping. Simulation on the prediction model for volume of population migration based on big data analysis [J]. Computer simulation, 2014, 31(10): 246?249.
[10] 邓杰,钱雪忠,钱恒,等.基于特征选择的统计最优样本大小算法[J].计算机应用研究,2014,31(12):3535⁃3538.
DENG Jie, QIAN Xuezhong, QIAN Heng, et al. Statistical optimal sample size algorithm based on feature selection [J]. Application research of computers, 2014, 31(12): 3535⁃3538.