那么把我们应用部署到到多台APP SERVER(TC CLIENT)后处理程序就会增多,按照原理,处理速度应该会增快。但事实上,经过我们测试后,发现性能并没有多大的提高 ...
这里有几个概念需要搞清楚:吞吐量和延迟,如果部署到多台APP,按道理,是吞吐量增长,就象原来小港口现在变成大港口,货物吞吐量上去了,但是每个货物的装卸速度和兵马俑无关,也就是你所说的性能。
你所说的性能是每个页面的加载速度或每个交易的处理时间。
以上指标需要定性,可参考jivejdon的Jmeter测试结果,其中averge min max是你要的性能,而througout是吞吐量,和分布式系统有关,也就是说,你使用了集群 分布式系统是扩展了吞吐量,无法提高单机性能的。

对于你这个案例,非常类似LMAX架构,使用单线程每秒可处理600万订单,这才是你要的性能。
提高性能,向非堵塞NoBlocking方面发展,你使用的LinkedBlockingQueue是一种堵塞队列,性能肯定不高,推荐使用Disruptor替代,见这个帖子。