Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
图像识别
腾讯发布了自己的“ControlNet”版本: T2I-Adapter
ControlNet 是一种通过添加额外条件来控制扩散模型的神经网络结构。 ControlNet可以对使用扩散模型生成的图像进行精确、细粒度的控制。这是一个巨大的进步,将改变许多行业。
可识别图像中100种人类语言文本的纯Javascript OCR库包:Tesseract.js
Tesseract.js是流行的Tesseract OCR引擎的纯Javascript引擎。该
基于Tensorflow图像分类模型的微服务
这是一个Tensorflow图像分类模型,可以在您的应用程序中用作微服务。 传递给容器的分类模型应基于Google的in
GoFaceRec:基于 Go 的深度学习人脸识别工具
GoFaceRec是一个用 Go 构建的人脸识别工具,利用 MTCNN 进行人脸检测和 QMagFace 进行人脸识别。 该项目的诞生是出于将深度学习模型的力量引入 Go 社区的愿望。经过一番努力,我得出的结论是,最好的方法是将模型转换为 Tens
AnimateAnyone:让照片变动画(阿里)
为任何人制作动画:拍一张照片,就能通过这个AI项目让照片中的人动起来,角色动画的一致且可控的图像到视频合成,项目点击标题
OpenAI 为 ChatGPT 用户推出 Sora 视频生成器
OpenAI 今天在 Sora.com 上推出了其备受期待的 AI 视频生成器 Sora,但可用性有限。 该服务将在美国和许多其他国家/地区推出,但值得注意的是,大多数欧盟国家和英国均未提供该服务。虽然 OpenAI 首席执行官 Sam Altman 尚未
OpenAI新规放宽限制,创作自由与安全如何平衡?
OpenAI 公布了 GPT-4o 的图像生成新指南,这标志着他们开始往给用户更多创作自由、同时还留点安全底线这个方向走。OpenAI 在 Substack 帖子中仔仔细细讲了公司为啥要这么改。他们说,公司不想再搞特别严的限制了,要多给用户自己做主的空间。