实时屏幕翻译技术刚刚开源:https://github.com/ramjke/Translumo
它可以读取并翻译游戏、视频、字幕以及屏幕上任何内容的文本。即时完成。
之前:截图、复制粘贴、等待工具处理。
之后:它就一直运行着。
API费用为零。100%本地化。开源。
高能实时屏幕翻译神器
你有没有过这种瞬间?玩游戏看着弹幕、攻略、NPC对话全英文,你心里哇塞,英语好像学了一半?别慌,我今天给你介绍一款神奇的工具,名字叫Translumo,它能把你屏幕上的文字瞬间翻译成你能理解的语言,而且超快,几乎没有延迟,简直像请了个无形的小翻译随身跟着你。它不仅支持游戏场景,还能覆盖任何桌面应用。小伙伴们,我保证你看完之后会忍不住想赶紧下载试试。
Translumo有一个兄弟项目叫Lookupper,它是个屏幕词典,主要目的是让你真正学语言,而不是死抱着翻译器不放。Lookupper有免费版和Pro版,如果你用得爽,升级Pro还能支持它和Translumo的开发,这就是典型的正向因果,你用得爽,开发者有动力,大家都爽。
下载与安装简直零难度
下载Translumo超级简单,直接点链接就能拿到最新版本,解压之后运行Translumo.exe即可。版本1.0.x在功能上相比0.9.x有大幅升级,细节改动可以在Release页面看到。安装过程没有复杂步骤,几乎没有学习成本,这是它的一大亮点,尤其适合不想折腾配置的小伙伴。
版本升级最大的亮点是提高了OCR识别精度。Translumo支持同时使用多个OCR引擎,它会用机器学习模型给每个OCR结果打分,然后挑出最优结果。这意味着屏幕上的文字,无论是游戏UI还是网页内容,它都能精准识别,翻译质量直线上升。看到这里,你可以理解为什么它被称为高级实时屏幕翻译神器。
OCR引擎选择与优化策略
Translumo集成了多种OCR引擎:Windows OCR(推荐)、Tesseract 5.2(旧版)、EasyOCR(旧版)。推荐使用Windows OCR,因为Tesseract速度慢,还容易出错,EasyOCR更慢,需要高性能GPU并且容易产生bug。保留旧版引擎主要是为了兼容历史用户,但新手直接用Windows OCR就够了。
在选择识别区域时,尽量缩小捕获范围,这样可以减少识别到背景杂乱文字的概率。大区域会增加处理时间,这是一条简单而高效的优化策略。记住,屏幕翻译速度跟捕获区域大小呈正相关,你越精准,它越快。
翻译引擎和语言支持
Translumo支持的翻译引擎也丰富:DeepL(推荐)、Google Translate、Yandex Translate、Naver Papago。语言覆盖面几乎全世界,从英语、俄语、日语、中文、韩语,到法语、西班牙语、德语、意大利语,再到越南语、泰语、土耳其语、阿拉伯语、希腊语等多达数十种。你要的几乎都能翻,而且翻译结果精准可靠,这就保证了使用体验的正向循环:你看得懂,效率提升,使用感受极好。
为了防止被翻译服务封IP,Translumo提供代理列表功能,可以设置1到2个IPv4代理,轮流使用,保证翻译请求顺畅。这一点尤其适合高频使用场景,比如看攻略或者刷游戏字幕,不会因为频繁请求被封。
系统需求与性能优化
Translumo的系统需求分两类。如果使用Tesseract和Windows OCR,最低需求是Windows 10 2004或更高版本,支持DirectX 11的GPU,2GB内存。如果使用EasyOCR,需要NVIDIA GPU支持CUDA 11.8,8GB内存以及至少5GB可用存储空间。这意味着普通笔记本可以用Windows OCR顺畅运行,而高级GPU玩家可以尝试EasyOCR,但Windows OCR已足够大部分场景。
在游戏中使用Translumo,需要使用无边框或窗口模式,而非全屏模式,这样翻译覆盖窗口才能正常显示。如果游戏不支持窗口模式,可以用Borderless Gaming工具。正确的显示方式直接决定了翻译体验,延迟低、覆盖准,让你看游戏字幕不再费劲。
快捷键与使用技巧
打开设置用Alt+G,选择OCR语言和翻译语言,定义捕获区域按Alt+Q,开始翻译用波浪线键。遇到翻译窗口被游戏覆盖,按Alt+T可以切换显示。设置合理的快捷键和捕获区域,配合代理和推荐OCR,你就可以在任何应用场景下,享受即时翻译的爽快感。
遇到EasyOCR安装失败,可以尝试VPN重新下载;如果热键不起作用,可能是其他程序拦截了快捷键;Tesseract识别失败,要确保应用路径仅包含拉丁字母。每个问题都有正向解决方法,你按步骤操作就能顺利翻译。
构建与开发环境
如果你想自己编译Translumo,需要Visual Studio 2022和.NET 8 SDK。克隆master分支后,运行binaries_extract.bat会自动下载和解压模型及Python二进制文件,大约400MB。这样你就拥有完整可用的开发环境,方便二次开发或者自定义功能。
致谢与替代方案
Translumo依赖多个优秀开源项目,包括Material Design In XAML Toolkit、Tesseract .NET wrapper、OpenCvSharp、Python.NET、EasyOCR以及Silero TTS。社区的力量让这个工具不断完善,同时也给你提供了丰富的二次开发可能。替代方案如Lookupper、ScreTran、ScreenTranslator,也提供类似屏幕翻译和词典功能,但Translumo在实时性和优化策略上更突出。
总结来看,Translumo不仅是一个实时屏幕翻译工具,它还通过精细的OCR评分、多引擎支持、代理策略和快捷键优化,让语言学习和跨语言操作都变得轻松高效。无论你是游戏玩家还是跨语言办公用户,它都能瞬间提升你的信息获取能力和效率。