• AI界“最后一块遮羞布”被撕碎!曾经让全球大模型集体折戟、号称“人类智商试金石”的ARC-AGI benchmark,被一家名不见经传的初创Poetiq直接干到85%+,连升级版ARC-AGI-2都被踩在人类平均分脚下。 我们以为的“抽象推理天花板”,原来