新年新气象
01-31
最近几个服务器频频出事,虽然不是自己的服务器,经验还是值得学习的。
在做高可靠性方案的时候,我们应该信任谁,是个问题。
首先是域名。一般域名都是委托给idc,或者专业做dns的,作为网站的入口,交给他们就等于绝对的信任他们,没有备份方案。如果带有些许的不信任,可以设置备用dns为自己的dns服务器。dns一般没太大的问题,但一旦有问题就是大问题,万网新网好像都发生过dns服务器大规模故障,全国各地大面积瘫痪,不能不说,对域名的信任存在问题。
链路,说到链路,这是个大问题,也许也包含了域名的问题。
从dns,网关,路由,响应,各个节点负载,都需要经过详细测试。
一般销售推销带宽,只是简单让测试ping值,但实际是不科学的,因为在用的时候,我选择的带宽ping值的确很好,但实际应用效果缺不理想,没有那个系统是靠ping值来保障的,域名服务器,网关速度,交换,路由的处理能力都是硬指标。很多服务器ping值好,但数据一流起来可就没那么好了。承诺给你大的带宽,可带宽要局限在一个固定的环境中,无异于局域网应用。
我们需要的是优秀的广域网应用,所以,最好的测试还是把服务架上,实际去跑一阵应用服务,才能最终确定带宽和链路的质量。
中间跳了很多环境,涉及了宽带提供商,运营商,代理,现场技术,用户等很多环节,保证每个环境的通路才是最终的通路。任何一个环节都可能成为瓶颈和以后应用的隐患。
但在中国的网络环境中,我们应该信任谁?
Linux下APACHE MYSQL PHP FCgid Suexec 自动安装脚本V2.3
1、补全了支持的字符集,默认为utf8
该死的网管,昨天就发现网络不正常,没注意,以为是机房不稳定,可这种状态持续到了今天。话说这状态非常诡异,可以ping通,很快,偶尔也能应用一些服务,httpd,ftp,ssh,但有时候任何服务都中断,只是ping的通。
但是如果ssh一直保持会话,突然中断后,ssh还能顺利跟服务器通讯。
这可难坏了我这个牛叉的系统工程师和一个CCIE级大哥,我又发挥流氓黑客的精神,彻底扫描了服务器端口和一些数据包,发现几个疑点:
1、服务器通讯正常的时候,所有端口的包数据都是正常的,是我自己服务的标志。
2、服务器通讯异常的时候,服务端口有变,并且出现异常数据。
疯狂google后发现,有这么几个可能性:
1、dell的网卡驱动没有装好,会产生MAC地址跳跃(mac地址都是写在芯片里的,汗!)。
2、ip地址被盗用了。
第一条已经排除,下载dell网卡驱动后,重装后也正常。问题依然存在。
第二,我跟那边网管要了个新的ip,一切正常。
比较一下两个服务器的几个协议的头,上边是我的,下边是异常的
1、ftp
我牛叉的Pure-FTPd,mysql动态控制的
啥玩意,还真没见过
他的其他端口
特征码出来了,CTerminalSocket,google一下原来是作voip电话的服务器,逮着了,回头砸他服务器去!
Dell1950终于上架了,又一个牛叉的系统,我把CentOS精简到了我能想象到的极致(当然跟gentoo还不能媲美),在AMP(apache,php,mysql)都启动空负载的状态下,内存占用降到了128M以下。
一些内核级补丁没有打,估计了解这类漏洞入侵的人,我暂时也招架不住,现在只是为了服务器的稳定。apache+php+mysql+ftp+ssh之类的账户权限作了详细的统筹,对外服务权限尤其作了限制,尽量达到最优。PHP是用developer模式进行编译安装,没有考虑实际应用,只是把功能尽量多的增加(这些操作会稍微影响性能,但相对128M,是可以忽略的),但很重要的opcode缓冲加上了,Centos用最小安装,以来的一些组件和库分别安装,决不多余。尽量在硬盘基础占用上也降至最小。硬盘分区使用了LVM,偷懒了,虽然这样会有很大的问题,但手工分区还不是很熟悉,而且在管理存储上我功力还不够,以后进行改善。
硬盘情况如下:感觉还是大了点,回头清理一下缓存。
很成功的系统,但管理软件我一直没功夫去写,待写完后就是一个完整的初始系统+管理套件