图像识别

     

AnimateAnyone:让照片变动画(阿里)

426
为任何人制作动画:拍一张照片,就能通过这个AI项目让照片中的人动起来,角色动画的一致且可控的图像到视频合成,项目点击标题论文角色动画旨在通过驱动信号从静态图像生成角色视频。目前,扩散模型因其强大的生成.

GoFaceRec:基于 Go 的深度学习人脸识别工具

800 2K

GoFaceRec是一个用 Go 构建的人脸识别工具,利用 MTCNN 进行人脸检测和 QMagFace 进行人脸识别。该项目的诞生是出于将深度学习模型的力量引入 Go 社区的愿望。经过一番努力,我得.

腾讯发布了自己的“ControlNet”版本: T2I-Adapter

2393 3

ControlNet 是一种通过添加额外条件来控制扩散模型的神经网络结构。ControlNet可以对使用扩散模型生成的图像进行精确、细粒度的控制。这是一个巨大的进步,将改变许多行业。ControlNe.

可识别图像中100种人类语言文本的纯Javascript OCR库包:​​​​​​​Tesseract.js

1545

Tesseract.js是流行的Tesseract OCR引擎的纯Javascript引擎。该库支持100多种语言,自动文本定向和脚本检测,用于读取段落,单词和字符边界框的简单界面。Tesseract.

基于Tensorflow图像分类模型的微服务

1303

这是一个Tensorflow图像分类模型,可以在您的应用程序中用作微服务。 传递给容器的分类模型应基于Google的inception模型。 有关详细信息,您可以阅读文档或观看指南。运行:docker.