Sam Bhattacharyya这位老哥可不是普通码农,他是麻省理工学院(MIT)AI与机器人方向的正经科班出身,早在2021年就成功卖掉了自己的第一家AI初创公司。
那家公司做的是疫情期间爆火的视频会议AI功能套件,比如虚拟背景、降噪滤镜这些,被客户直接收购,妥妥的技术变现案例。之后他加入了一家2000人规模的大公司担任AI产品负责人,直到2024年公司被私募火速甩卖,他才出来单干。
现在他的主业是一款叫Katana的AI视频剪辑工具,目标是打造一个能替代人类剪辑师的“视频基础大模型”。
但你猜怎么着?真正赚钱养活他的,居然是他2023年圣诞节在丈母娘家熬夜写的一个“玩具级”浏览器AI超分工具——Free AI Video Upscaler。
这个工具最初只是他用来练手WebGPU的新技术demo,结果却在无人运营、无任何营销的情况下,用户量悄悄涨到每月3万,还顺带催生了一个月收2800美元的付费服务。
故事听起来像爽文,但背后全是技术细节和真实数据,值得每一个创业者、开发者、AI爱好者细品。
从被AI行业拒之门外,到用WebGL手写神经网络逆袭
时间倒回2012年,Sam刚从MIT研究生毕业,满脑子AI和机器人,信心满满想进科技公司。
结果现实狠狠打脸——当时整个硅谷都在疯狂追移动App,面试官一开口就是“你会做iOS吗?”“能开发Android应用吗?”,而他只会写算法、调模型。
没人要他,AI在当时就是个冷门中的冷门。
于是他做了一个大胆决定:不找工作了,自己创业!第一家公司做在线教育App,结果从产品到融资全都踩坑,五年换了十次方向,差点破产。
但正是这段“地狱模式”的经历,让他学会了怎么真正理解用户、验证需求。
最终在疫情期间,他们团队把AI虚拟背景和降噪功能做成SDK插件,嵌入到各类视频会议软件中。
关键来了:当时主流方案是用TensorFlow.js或MediaPipe,这些方案把服务器端的AI框架硬搬到浏览器里,导致CPU和GPU频繁通信,性能极差——尤其在200美元的老旧笔记本上,一开虚拟背景电脑就冒烟。
于是Sam团队干了一件疯狂的事:他们直接用WebGL手写神经网络!没错,不是调库,而是像写游戏渲染器一样,在图形着色器里一行一行实现卷积运算。
这样做出来的AI滤镜,效率比Google Meet还高,最终成了被收购的核心筹码。
这段经历也埋下了日后WebSR SDK的种子——他始终相信:AI模型必须为运行环境深度优化,而不是反过来让用户迁就AI框架。
WebGPU时代来临,他随手写了个AI超分SDK当练手
2023年,WebGPU正式上线,这是WebGL的继任者,能直接调用GPU进行通用计算,性能飞跃。
Sam觉得这技术太酷了,但又不知道干啥用,于是决定拿“AI视频超分”练手。
为什么选这个?因为超分说白了就是个“聪明的锐化滤镜”——输入低清画面,输出高清画面,结构简单、训练快、效果肉眼可见,特别适合新手上手WebGPU。
于是他在圣诞节假期,晚上等家人睡了之后,偷偷写了几天代码,搞出了一个叫WebSR的TypeScript SDK。
它能在浏览器里直接调用WebGPU运行超分神经网络,全程不依赖任何外部AI运行时。核心代码简洁得令人发指:
import WebSR from '@websr/websr'; |
为了证明这个SDK真能用,他顺手搭了个网页工具,让用户上传视频,自动超分后下载。他注册了域名free.upscaler.video,发了个Reddit帖子,然后——彻底忘了这回事。
他哪知道,这个“弃子”即将上演一出互联网时代最魔幻的逆袭剧。
被用户疯狂@才想起去看数据,结果惊掉下巴
Sam的主业Katana在2025年7月上线,他一个人孤军奋战,从模型训练到前端交互全包,几个月才拉到十几个付费客户。
他每天焦头烂额,根本没空管那个免费工具。
直到2025年5月,他一周内收到15条私信,都在说“你的网站坏了!”——原来是Chrome的一次更新破坏了视频处理流程。
他只好花周末修bug,顺手点开了尘封一年的Google Analytics后台。结果屏幕上的数字让他愣住了:过去一年,free.upscaler.video的月活用户从3000暴涨到30000,增长10倍!而且全是自然流量,没有任何推广。
更离谱的是,很多用户甚至专门注册GitHub账号,就为了给他提issue报错。
他这才意识到:这个他看不上的“玩具”,每天都有上千人在用,有人用它处理AI生成的短视频,有人用它修复下载的老电影,还有游戏主播拿它把1080p录屏硬拉成4K。而他自己,却在为只有几十个用户的Katana熬夜掉头发。
那一刻,他内心一万头羊驼奔腾而过:为什么我拼命做的产品无人问津,随手一扔的demo却自己长腿跑起来了?
“没人会为这玩意儿付费”——结果103人抢着给1美元定金
修好bug后,有朋友劝他:“既然这么多人用,干脆做个付费版吧,用更大的模型跑在服务器上,效果更好。”
Sam第一反应是嗤之以鼻:“怎么可能?谁会为这种免费工具掏钱?”
但他转念一想,试试又不亏。
于是他花了两小时用Vercel“vibe coding”(凭感觉瞎写)搭了个付费版落地页,定价策略更是离谱——直接拍脑袋定成5美元/小时视频处理。
他还搞了个限时优惠:“1美元换20美元额度”,并把链接加在免费工具的首页。
他本以为最多十几个人点,结果一个月内103人付款!是他预期的4倍。
更魔幻的是,他还在页面上加了一句:“10月1日前上线,否则全额退款。”这句话成了他的“道德枷锁”——为了不失信于人,他被迫认真搞起了付费版开发。而这时他才发现:市面上所有开源超分模型(比如RealESRGAN)都太吃资源,按5美元/小时的定价根本跑不赢成本。
于是他发挥老AI研究员的底子,自己从头训练轻量化模型,针对四类用户精准优化:AI视频营销人员、电影资源爱好者、专业剪辑师、游戏录屏玩家。6周时间,100多次训练实验,烧掉5000多美元云服务器费用,他硬是搞出了一套能在低价位跑出高质量效果的私有模型。
免费版顺手优化一下,日活直接翻倍
付费版在9月30日压线发布后,他把学到的经验反哺回免费工具。
他用新训练的轻量模型替换了旧权重,又让大模型帮忙重写了页面标题、描述、FAQ,还把UI改得手机友好。
就这么几个微小改动,免费工具的日活在一个月内从1100飙升到2300,几乎翻倍!
他感慨道:我为Katana做的用户调研、功能迭代、冷启动推广,效果还不如给免费工具修几个bug、改几行meta标签。
这彻底颠覆了他对“产品增长”的认知——有时候,不是产品不够好,而是你没戳中那个最痛的痒点。而那个痒点,往往出现在你最不经意的地方。
无营销、无团队、无推广,却实现月入2800美元的“躺赚”奇迹
从10月开始,他在免费工具首页挂上付费入口,每天就有几百人点进去,其中50%注册账号,8%直接付费。
收入曲线清晰得可怕:9月0美元,10月1400美元,11月2800美元。
虽然金额不大,但成本极低——服务器费用、带宽、CDN加起来远低于收入,已经接近盈亏平衡。
最关键的是:这一切都是“无营销”达成的。没有投广告,没有发邮件,没有搞社群,用户全是自然流入,自发传播。
而他那个倾注了全部心血的Katana,还在为几十个用户苦苦挣扎。
这种强烈的反差让他陷入哲学思考:创业到底是拼努力,还是拼运气?为什么有些项目像推石头上山,累死累活没人看;而有些项目像滚雪球下坡,你躺平它自己就长大?
他最终得出结论:产品市场契合度(PMF)不是靠“做”出来的,而是靠“发现”出来的。
你永远不知道哪个小功能会击中大众的G点,所以不要过早否定任何一个side project。
他现在该怎么办?继续搞高大上的视频大模型,还是拥抱这匹黑马?
目前Sam陷入了甜蜜的纠结。
Katana是他技术理想主义的结晶——一个能理解音视频+文本的多模态视频编辑大模型,野心勃勃,难度极高。
而upscaler工具技术含量低、天花板明显,注定成不了巨头。
但现实是:后者在默默给他输血,让他有底气继续搞研究,不用为融资发愁。
他意识到,或许真正的高手,不是只盯着“改变世界”的宏大目标,而是懂得在“理想”与“现实”之间动态平衡。
他决定接下来几个月,先全力优化upscaler工具,把它做成一个稳定盈利的现金牛,同时用它的收入反哺Katana的研发。
他也开始重新评估那些曾经被他视为“分心”的技术side project——比如提升语音识别速度的新算法、基于WebGPU的开源AI滤镜SDK。谁知道呢?也许下一个爆款,就藏在下一个“随手一写”的demo里。
附:工具与代码资源,欢迎体验和贡献
如果你也想试试这个神奇的AI视频超分工具,可以访问免费版网站:https://free.upscaler.video。
它完全在浏览器中运行,无需注册、无需下载,支持Chrome和Edge最新版。如果你是开发者,项目代码已完全开源。
前端工具代码位于:https://github.com/sb2702/free-ai-video-upscaler,而核心的WebSR SDK则在这里:https://github.com/sb2702/websr/。
SDK支持多种超分模型(anime4k/cnn-2x-s/m/l),还内置了内容风格检测功能(通过MobileNet判断画面是动画还是实拍),开发者可自由集成到自己的Web应用中。Sam也欢迎社区提交PR,尤其是Worker线程支持、更多网络模型、移动端适配等方向。
也许你的一个commit,就能让这个“意外爆款”走得更远。