早上被娃叫醒,服务器出问题了!
最后发现是服务器上一个进程crash掉了。这个进程跑了好几年了,每天重启一次,从来没有任何问题。今天突然挂掉了。
唯一能找到的错误信息,貌似和python2里字符串的encode/decode相关。但是因为第一条log信息就有问题,看不到具体是啥。按道理这里的信息都是我们内部发送的,一直是英文。难道有人攻击?
自己测试了一下,尝试了各种语言,特殊符号,都重复不出来。只好把log也保护起来,这样有问题最起码不要crash。你觉得肯定不会出问题的地方,往往就会出问题。
手动启动了进程,希望不要再出问题,又希望再出问题,好找到问题所在。现在过两分钟看一下进程是否还在,强迫症了。