一、本文目的
在涉及网络编程的实际项目应用中,由于网络不可能一直处于理想状态,TCP长连接也可能随时正常或异常地断开,如果不予处理,那么就可能因此而给程序带来很多潜在的问题。 编写该文档的目的就在于针对网络程序中可能遇到的各种问题,拿出来与大家探讨一下具体问题的解决方案,同时本人将前期调研的一些解决方案列出来,抛砖引玉,希望可以集思广益,寻求到更加合理的解决方案。
二、网络断开时机
1、正常网络断开
(1) CS 一方调用 Close
(2) CS 一方程序正常退出,如Ctrl + C 事件可以被系统检测到,对应的套接字也将被系统标记为已断开。
2、异常网络断开
(1) CS 一方网线被拨出
(2) CS 之间路由故障,物理连接断开
(3) CS 一方断电或当机
(4) CS 一方无线信号不佳或无线接口被关闭
(5) CS 一方更改 IP 事件无法被系统检测到,这个时候读数据不会出错,只会一直阻塞着;写数据在缓冲区未满之前也不会返回错误。若无法及时检测到断开事件,对某些应用场景而言可能存在致命的错误。如服务端维护的客户端在线信息错误等。
三、网络断开常用检测方法
1、处理正常网络断开
(1) select 捕捉可读事件,read返回0
(2) epoll 捕捉可读事件,read返回0
(3) 主动 read 返回错误
(4) 主动 write 返回错误
2、处理异常网络断开
(1) 应用层KeepAlive检测
在应用层协议加入心跳握手机制,维护服务端跟客户端之间的连通状态,是最普遍最保险的办法。 客户端定时向服务端发送探测包,若服务端回应则说明服务端在线,否则作离线处理;服务端也可对长期未发送探测包的客户端作离线处理。 该方案所有系统都支持,跨平台性好;对端跟自身出现网络故障都能检测到。不足之处在于它需要应用层协议支持,程序内部需要长期维护心跳握手包,相对比较繁琐。
(2) 传输层KeepAlive检测
除了应用层 KeepAlive 检测机制外,TCP 内部也集成了 KeepAlive 机制,默认关闭,开启它很方便。对端跟自身出现网络故障都能检测到。但不是所有的系统都支持,而且有些系统虽然支持但会影响到所有套接字,消耗额外的宽带和流量,不建议使用。
//启用心跳机制,如果您想关闭,将keepAlive置零即可 setsockopt(fd,SOL_SOCKET,SO_KEEPALIVE,(void*)&keepAlive,sizeof(keepAlive)); //启用心跳机制开始到首次心跳侦测包发送之间的空闲时间 setsockopt(fd,SOL_TCP,TCP_KEEPIDLE,(void *)&start,sizeof(start)); //两次心跳侦测包之间的间隔时间 setsockopt(fd,SOL_TCP,TCP_KEEPINTVL,(void *)&interval,sizeof(interval)); //探测次数,即将几次探测失败判定为TCP断开 setsockopt(fd,SOL_TCP,TCP_KEEPCNT,(void *)&count,sizeof(count));
(3) 网络层KeepAlive检测
Ping 命令几乎是所有平台的网络连通性检测命令,走网络层 ICMP 协议,这里考虑使用 popen 函数调用系统自带的 Ping 命令来封装网络连通性检测函数。它实际上也是一种网络层的 KeepAlive 机制。
int checkConnect(char *dst, int cnt) { FILE *stream; sprintf(cmdBuf, "ping %s -c %d -i 0.2 | grep time= | wc -l", dst, cnt); stream = popen(cmdBuf, "r"); fread(recvBuf, sizeof(char), sizeof(recvBuf)-1, stream); pclose(stream); if (atoi(recvBuf) > 0) return 0; return -1; }
dst 指定要检测的目的地址,cnt 指定 Ping 尝试的次数,-i 参数指定 Ping 尝试的超时时间。
(4) 应用层监控内核消息机制
Netlink 是一种特殊的套接字,为2.6.14及更高版本的Linux所特有,通过它,应用层程序可以方便地向内核订制指定消息,如网卡上下线。也可以设置或查询配置,如IP、路由、网络流量信息等。
a、创建一个 netlink 套接字:
fd = socket(AF_NETLINK, SOCK_RAW, NETLINK_ROUTE);
b、绑定路由多播组,监控网卡信息:
addr.nl_family = AF_NETLINK; addr.nl_groups = RTNLGRP_LINK; //指定接收路由多播组消息 bind(fd, (struct sockaddr*)&addr, sizeof(addr));
c、监听套接字,一旦可读,解析其内容,实时监控网卡上下线事件。
优点:实时性高,使用方便。
缺点:跨平台性不佳,只能检测自身网络故障。
(5) 应用层网卡信息轮询机制
网卡信息轮询机制就是定期调用 ioctl 函数执行如下操作:
struct ifconf ifc; struct ifreq ifrcopy; //获取网卡信息列表 ioctl(fd, SIOCGIFCONF, (char *)&ifc); //获取网卡上下线状态 ioctl(fd, SIOCGIFFLAGS, &ifrcopy); //获取 MAC 地址 ioctl(fd, SIOCGIFHWADDR, (char *)(&ifrcopy); //获取 IP 地址 ioctl(fd, SIOCGIFADDR, (char *)&ifrcopy); //获取广播地址 ioctl(fd, SIOCGIFBRDADDR, &ifrcopy));
缺点:
a、跨平台性不佳。
可以成功移植到 Linux、Android、Windows平台,但由于 iPhone 平台上获取MAC跟IP的参数不同,需特殊处理。
b、实时性跟灵活性不高。
c、耗费资源,影响性能。
d、只能检测自身网络故障。
除非注明,文章均为CppLive 编程在线原创,转载请注明出处,谢谢。
挺不错的~~ 赞一个!
多谢肯定~