多线程与Spring容器事务机制 - DZone


Spring 负责所有底层事务管理细节,并为不同的事务 API 提供一致的编程模型,但有多少人真正了解它在多线程环境中的行为方式?是否可以在多个线程中打开事务并写入数据?

让我们退一步思考一下EntityManager。
EntityManager的工作是与一个会话或被它管理的对象的缓存一起进行的。这意味着它有一个状态,而在几个线程之间共享状态会导致竞争条件;
所以,第一条规则是每个线程使用一个EntityManager。

事实上,Spring负责保持每个线程的事务性上下文。
假设我们想并行处理一个对象列表并将其存储在数据库中。我们想把这些对象分成专门的小块,并把每个小块传递给一个单独线程中的处理方法。然后,每个线程中处理的结果应该被收集起来并呈现给用户。

我将从定义一个负责处理的服务接口开始:

/**
 * Service interface defining the contract for object identifiers processing
 */

public interface ProcessingService {

    
/**
     * Processes the list of objects identified by id and returns a an identifiers
     * list of the successfully processed objects
     * 
     * @param objectIds List of object identifiers
     * 
     * @return identifiers list of the successfully processed objects
     */

    List<Integer> processObjects(List objectIds);
}

这项服务的默认实现是基于数据库存储的。然而,这个例子是非常简单的:

/**
 * Service implementation for database related ids processing
 */

@Service(
"ProcessingDBService")
public class ProcessingDBService implements ProcessingService {
    
    private static final Logger logger = LoggerFactory.getLogger(MethodHandles.lookup().lookupClass());
    
    @Transactional
    @Override
    public List processObjects(List objectIds) {
       
// Process and save to DB
        
    logger.info(
"Running in thread " + Thread.currentThread().getName() + " with object ids " + objectIds.toString());
        
    return objectIds.stream().collect(Collectors.toList());
    }
}

现在,我们希望有一个选项,可以在块chunk(类似队列一样数据块)和并行进程中运行这个处理。

为了保持代码的干净和与运行时环境的解耦,我们将使用装饰器模式,如下所示。

/**
 * Service implementation for parallel chunk processing
 */

@Service
@Primary
@ConditionalOnProperty(prefix =
"service", name = "parallel", havingValue = "true")
public class ProcessingServiceParallelRunDecorator implements ProcessingService {

    private ProcessingService delegate;
    
    public ProcessingServiceParallelRunDecorator(ProcessingService delegate) {
        this.delegate = delegate;
    }

    
/**
     * In a real scenario it should be an external configuration
     */

    private int batchSize = 10;

    @Override
    public List<Integer> processObjects(List objectIds) {
        List<List<Integer>> chuncks = getBatches(objectIds, batchSize);
        List<List<Integer>> processedObjectIds = chuncks.parallelStream().map(delegate::processObjects)
                .collect(Collectors.toList());

        return flatList(processedObjectIds);
    }

    private List<List<Integer>> getBatches(List collection, int batchSize) {
        return IntStream.iterate(0, i -> i < collection.size(), i -> i + batchSize)
                .mapToObj(i -> collection.subList(i, Math.min(i + batchSize, collection.size())))
                .collect(Collectors.toList());
    }

    private List<Integer> flatList(List> listOfLists) {
        return listOfLists.stream().collect(ArrayList::new, List::addAll, List::addAll);
    }

实际的调用被委托给一个处理服务的实现,但Decorator负责跨线程的工作分配和收集结果。
装饰器模式的实现使客户端代码不知道实际的实现。可以直接注入单线程版本,也可以注入多线程版本,而无需直接改变客户端代码。

为了理解客户端代码可能是什么样子的,让我们看一下一个简单的单元测试。

@RunWith( SpringJUnit4ClassRunner.class )
@SpringBootTest(properties = { "service.parallel=false" })
public class ProcessingServiceTest {
    
    @Autowired
    ProcessingService processingService;
    
    ProcessingService processingServiceDecorator;
    
    @Test
    public void shouldRunParallelProcessingUsingDecorator() {
        processingServiceDecorator = new ProcessingServiceParallelRunDecorator(processingService);
        List objectIds = Arrays.asList(new Integer[] { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12});
        
        List resultList = processingServiceDecorator.processObjects(objectIds);
        
        Assert.assertEquals(objectIds, resultList);
    }
    
}

该代码传递了一个objectIds的列表,并运行测试中明确创建的Decorator服务。

预计由于内部配置的chunk大小为10,两个线程将处理数据。通过检查日志,我们可以看到以下几行。

ProcessingDBService: Running in thread ForkJoinPool.commonPool-worker-3 with object ids [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
ProcessingDBService: Running in thread main with object ids [11, 12]

在正好两个线程中,并行流使用主线程进行处理,第二个线程在它们之间分配工作。

这种处理的一个重要方面是事务处理。前10个元素在一个事务中被处理,而最后2个元素在另一个事务中被处理。
如果你看一下ProcessingDBService,你会看到公共方法被注解了@Transactional注解。这就是Spring预计的工作方式:它负责在专用的ThreadLocal对象中为每个线程保存事务上下文,不支持在一个事务中运行多个线程。

本文没有涉及错误处理,但会在以后的文章中加以阐述。还有一点需要注意的是,Decorator类中的依赖注入是基于构造器注入的。为了被Spring容器所管理,你可能需要在构造器中使用@Qualifier。

源码在:GitHub.