新研究：AI加速复杂上下文中的问题解决

研究人员开发了一种新的数据驱动的机器学习技术，可以加速用于解决复杂优化问题的软件程序，这些问题可能有数百万个潜在的解决方案。他们的方法可以应用于许多复杂的物流挑战，例如包裹路线、疫苗分发和电网管理。

问题目标：

对于像联邦快递这样的公司来说，有效路由假期包裹的优化问题非常复杂，以至于他们经常使用专门的软件来寻找解决方案。
假设一位旅行推销员想要找到访问多个城市然后返回其出发城市的最短路径。如果有许多城市可以按任意顺序访问，则潜在解决方案的数量可能比宇宙中原子的数量还要多。这个问题有指数量级的潜在解决方案

这些问题被称为 NP 难问题，这意味着不太可能有有效的算法来解决它们。MILP 求解器采用一系列技术和实用技巧，可以在易于处理的时间内获得合理的解决方案。

这种被称为混合整数线性规划 (MILP) 求解器，可将大规模优化问题分解为较小的部分，并使用通用算法来尝试找到最佳解决方案。然而，求解器可能需要数小时甚至数天才能得出解决方案。

他们确定了 MILP 求解器中的一个关键中间步骤，该步骤具有如此多的潜在解决方案，需要花费大量时间才能解开，从而减慢了整个过程。研究人员采用过滤技术来简化这一步骤，然后使用机器学习来找到特定类型问题的最佳解决方案。

该模型的迭代学习过程被称为上下文强盗：是强化学习的一种形式，包括选择一个潜在的解决方案，获得关于它有多好的反馈，然后再次尝试找到更好的解决方案。

该模型使用针对用户优化问题的特定数据集进行训练，因此它能学会选择最适合用户特定任务的算法。由于像联邦快递这样的公司以前曾多次解决过路由问题，因此使用从过去经验中收集的真实数据应该比每次从头开始都能获得更好的解决方案。

特点：

应用场景：

材料由麻省理工学院提供。原文由 Adam Zewe 撰写。