在线语义计算器 (king-man+woman=?) (datova.ai),点击标题
1+1=2这是算术公式
国王-男人+女人=女王 这是语义计算器
我最近在捣鼓一个叫'词嵌入'的黑科技(就是让电脑理解词语意思的技术)。大家都见过那种'国王-男人+女人≈女王'的经典例子对吧?
但我觉得光看这种标准答案太没劲了,就想看看如果只用最基础的加减法来玩文字游戏,到底能整出什么新花样。
于是我自己撸袖子写了个程序,这货不光能给出第一个匹配答案,还会像班级排名一样把所有可能的答案按相似度排个座次(用距离和余弦相似度这种数学尺子量的)。后来觉得独乐乐不如众乐乐,又给它加了几个炫酷功能,现在谁都能来玩两把。
不过得说清楚:目前我的词库只收了名词(比如'苹果''老师'这种),还有少量明星地名。遇到多义词(比如'苹果'可以是水果也可以是手机),系统会自动选最常用的那个意思。
对了,这程序还是个强迫症——字母大小写它都分得门儿清!
该词典基于https://wordnet.princeton.edu/,没有使用 word2vec。它只是在预先计算的嵌入中进行简单的查找(使用 mxbai-embed-large)。
网友热评:
data + plural = number |
网友测试:
为了好玩,我把这些粘贴到 ChatGPT o4-mini-high 中并征求它的意见:
data + plural = datasets |
结果出奇地好,我觉得作为人类我不可能做得更好。但请记住,这不像楼主那样进行嵌入数学运算!虽然它确实展示了通用的 LLM 如何比传统的 NLP 更好地解决某些任务。
我使用的提示:
> 还记得那些带有 AI 嵌入的“语义计算器”吗?比如“国王 - 男人 + 女人 = 女王”?假设你是一个语义计算器,请告诉我以下结果: |
其他网友测试:
它相当令人满意:
印度-亚洲+欧洲=意大利
日本-亚洲+欧洲=荷兰
中国 - 亚洲 + 欧洲 = 苏联
俄罗斯 - 亚洲 + 欧洲 = 欧洲俄罗斯
计算 + 机器 = 计算机
网友热评:
想象word2vec(词向量模型)就像个专门训练'词语连连看'的学霸。它的绝活就是让意思相近的词(比如'猫'和'老虎')在它的地图上住得特别近。但市面上很多其他嵌入API就像不靠谱的导游——它们画的地图根本不管词语的真正含义,随便乱标位置。
更坑爹的是,这些地图很多都是哈哈镜照出来的!本来应该是笔直的道路,在哈哈镜里变成歪七扭八的曲线(非线性空间)。这时候你试图用加减法算距离(比如'国王-男人+女人'),就像在哈哈镜前比划手势——结果完全失真!唯一还能勉强相信的,就只剩'谁离谁更近'这种粗略判断了。
网友:
太棒了!让我想起了:https://neal.fun/infinite-craft/
它提供了一个充满缓慢移动的点的面板。面板右侧有一些标有“水”、“火”、“风”和“地”的对象,您可以在面板上实例化它们并拖动它们。当您拖动它们时,如果背景点位于附近,则会长出与之相连的线条。这些线条不是持久的。
就是这样。什么都没发生,除了按住鼠标时出现的几行文字外,没有任何交互。虽然名义上有一个帮助窗口列出了所有控件,但实际只有“选择项目”、“删除项目”和“复制项目”这几个控件。此外,还有一个“关于”面板,但里面没有任何信息。
网友:
我测试了:
米饭+鱼=鱼肉
米饭+鱼+生食=肉
其实我想要结果是:寿司
没有上下文,单纯语义计算是可笑的。