一次并发Bug

最近碰到一个bug, 约7天发生一次,历时3周才找到问题并修复。 在找到bug并修复后,我仔细反思了一下。 我发现不仅这个bug是并发bug的一个典型,修复bug的过程也是直击我的弱点。 下面记录一下整个过程。 最近突然想对我的网络框架做一次RPC浸泡测试。 写了一段代码,开了6000个客户端,去并发RPC请求,服务端收到RPC之后会随机10~2500ms 延时之后再返回。 丢到我的VPS上之后,也没在意,过了两天就忘记这回事了。 过了大概一周,我突然想起来我还有一个浸泡测试在跑着呢,就上去看了……