公务员期刊网 论文中心 正文

数字油田4G网络下数据通信故障分析

前言:想要写出一篇引人入胜的文章?我们特意为您整理了数字油田4G网络下数据通信故障分析范文,希望能给你带来灵感和参考,敬请阅读。

数字油田4G网络下数据通信故障分析

摘要:随着数字油田、智能油田在大庆油田陆续推进实施,4g网络传输技术因其传输带宽大、稳定性好、覆盖面广、时延小等优势和特点,已经成为数字油田数据无线传输主要手段之一,也必将成为智能油田数据无线传输的重要支撑。本文将重点分析和总结当前数字油田4G网络下的数据通信故障,提出对应处理方案和解决办法,为今后开展数字油田、智能油田无线网络和自动化仪表维护工作提供指导帮助。

关键词:数字油田;网络传输;故障处理分析;数据采集

在数字油田架构中,无线网络覆盖数据采集子系统、数据传输子系统两个层级。近年来,随着油田公司公网接入DMZ隔离缓冲区的建成,4G传输网络因其传输带宽大、稳定性好、覆盖面广、时延小、数据防护安全可靠等优势,在数字油田数据无线传输过程中已被广泛应用。在数字油田4G无线网络覆盖下,接入设备较多,传输的数据量巨大,数据通信故障频发的情况不可避免,因此,研究制定故障解决方案、改进数据通信隐患具有重要意义。

1分析

采集数据到达SCADA服务器的路径和方式如下:井、间传感器将采集数据通过Zigbee无线网络传送到RTU,RTU依托4G(VPDN)网络组建的L2TP通道将数据上传至DMZ缓冲隔离区,并在L2TP通道基础上建立IPsec加密隧道将数据发送之生产网服务器,如图1。传输过程中出现以下问题和故障:

1.1RTU采集数据无法上传SCADA服务器

RTU向组态服务器发送登录报文,即同步位SYN=1时,RTU进入SYN-SENT状态,表示同步已发送。组态服务器收到RTU发送的登录请求后,发送确认数据包,确认报文字段,当ACK=1,此时组态服务端进入SYN-RCVD状态,表示同步已接收,RTU接收到组态服务器的确认报文后发送确认报文,此时双方TCP连接建立完成,双方都进入ESTAB-LISHED状态。遵循A11标准组态服务器每隔10分钟向RTU发送上传数据报文,RTU收到报文后发送寄存器数据。组态服务器回应报文,即FIN=1确认,回复FIN=0是没有收到或者是收到错误报文,在设置时间无响应则连接终止。在TIME-WAIT状态等待时间2MSL内,组态服务器没收到报文信息会发送关闭连接报文,组态服务器进入CLOSED状态。故障分析:一是由于网络不稳定性或其他原因造成RTU发送登录包超时;二是RTU发送数据连接报文超时,组态服务器在响应时间内没有接收到数据报文,会认为RTU不在线,结果造成连接关闭,数据无法传输。解决办法:一是增加RTU断线自动连接机制,在对方无返回报文情况下主动断开TPC连接,从新连接TPC发送同步位报文,等待组态服务器接收。检查发送登录报文是否属于无法校验报文;二是查看组态服务器参数配置如(MAC地址、校验码、加密配置、信道分配等)。发送接收数据包如图2。

1.2数据重复情况

RTU发出同步位连接请求,但是在网络中长时间滞留了而没有发送到组态服务器,此时由于RTU没有接收到组态服务器发送过来的确认请求,所以RTU就将连接释放了,在RTU释放了连接之后组态服务器又接收到了RTU发送过来迟到的连接请求,由于组态服务器不知道此时RTU已经释放了连接了,所以组态服务器认为是有效的连接。造成读取的数值是上一次数据。故障分析:一是在RTU发送同步位报文后,组态服务器没有给出回应,组态服务器确认RTU没有发送报文,或者认为这个报文异常或丢失,会继续等待接收下一条报文,RTU发送一条报文后寄存器没有更新下一次需要的数据,造成每次发送的数据报文都是同一条数据;二是组态服务器对接收到的报文进行校验,如果校验不通过会再ACK返回异常的报文seq,如果RTU没收到返回报文,认为组态服务器还处于LISTEN状态,会继续发送这条报文,造成组态服务器接收数据都是同一条数据。解决方法:一是RTU设置重传机制解决报文连接请求,设置一个启动计时器在有效时间内继续发送同步位报文。确认服务器登陆信息后开始建立连接,在RTU发送同步位报文后,RTU2分钟内还未得到确认信息,自动断开现有IP地址,从新拨号建立与组态服务器的连接,并确认组态服务器接收到信息后下发另一条数据报文;二是组态服务器设置响应时间,在规定时间内返回报文没有确认,重新发送数据请求包,建立新的连接。

1.3组态服务器无数据显示故障分析

由于网络中断引起RTU发送发出同步位连接请求后组态服务器没有接受到RTU发送的报文,无法给出下一次连接请求,造成RTU认为组态服务器一直在线,认为组态服务器收到登录信息,但没有下发报文请求,一直等待组态确认信息。导致数据发送超时后,组态服务器关闭连接报文,进入CLOSED状态。解决方法:一是查看附近是否有干扰源,造成同步失败;二是查看4G信号覆盖率和LTERSRQ信号接收质量;三是RTU发送登录报文后,在设定时间内确认组态服务器是否返回报文信息,查看组态服务器返回报文信息是否对应;四是超时没有回复报文情况下RTU自动重启设备重新连接TCP,发送登录报文即可解决。1.4组态服务器接收数据不全(服务器数据整体丢失,单组数据丢失)故障分析及解决方法:组态服务器数据排序机制把每条报文都包含一个SEQ序列号,这个序列号会从初始的值上进行递增,如果发送方发送seq=x,则接收方的ACK=x+1,如果丢了某一条报文,或者接收非法报文,则无法进行数值传递,下一组报文会空值,由于有停等协议每次只可发送一个报文,等确认之后才可发送下一个报文,在窗口占满的情况下无法向组态服务器进行发送报文。解决方法:一是由于网络拥堵或达到最大用户数造成掉线可以通过扩容的方法解决;二是RTU重启后更新同步位报文同时激活网络;三是RTU寄存器存储数据使时间小于上传时间,对于网络密集的传输修改上传报文时间。在符合油田A11协议下,通过改变RTU传输机制,打造智能化RTU。它可以自动判断获取的数据是否立即上报中心控制站,或者中心控制站要求时再传送数据。会自动检测通信的中断,支持自动重连、自动拨号。保证同步为报文正常发送,可以改变报文在网络的存储时间而不会当作错误报文删除。通过更加合理的RTU与组态服务器的设置优化,更好的保证数据的传输。

2结语

上述解决办法不仅适用于4G网络,同样可以解决网桥、WLAN等无线组网方式下的数据通信故障。分析过程和结论可以帮助数字油田运维人员精准定位问题、快速排除故障、缩短排障历时、提高工作效率。以前处理上述故障需要1~2天甚至更久,现在基本在几个小时甚至更短时间就能定位问题并完成障碍处理。同时文中列举的相关方法,在公司乃至油田范围内,具有一定推广价值,对提升公司数字油田运维能力和服务质量具有积极作用,通过进一步总结、提炼可以在今后形成公司数字油田数据通信方面的维护指导手册。

作者:陈国杰 单位:大庆油田信息技术公司规划设计中心