clubhouse使用机器学习实现人与聊天房间的匹配


早期,clubhouse开用简单的启发式方法对走廊上的房间进行排名,根据你有多少朋友在其中,或者房间的主题与你选择的主题有多密切等等来挑选和推荐房间。
后来,我们已经转向使用机器学习模型,它可以对走廊上的房间排名做出更细微的预测,从而提高整体质量。

我们的梯度提升决策树(GBDT)排名模型是根据数百个量化你在过去房间活动的各种属性的特征来训练的。
例如,该模型研究你是否在小型私人房间与大型公共房间中花费更多时间,或者你是否经常发言或喜欢倾听,并利用这些来为你的房间进行最佳排名。
该模型还关注房间本身的特点,如其持续时间和参与者的数量,以及俱乐部的特点。
排名模型也接受用户和俱乐部的嵌入向量作为输入。
这些嵌入在用户和俱乐部的互动数据上进行训练,以建立用户和俱乐部的密集表示。

该模型被训练成一个分类器,目标是过去房间印象中的房间加入/不加入。每个房间的分类器得分,一个在0和1之间的值,被用来确定房间在走廊中的相对顺序。

我们的模型训练和推理系统在很多方面看起来像一个传统的排名系统,但有一些关键的区别,这些区别来自于我们对现场房间进行排名的事实。迅速适应现场房间的变化和低预测延迟对于保持走廊的新鲜感和趣味性是最重要的。

详细点击标题