Dojo
最新
最佳
搜索
订阅
解道Jdon
架构设计
领域驱动
DDD介绍
DDD专辑
战略建模
领域语言UL
领域事件
商业分析
工作流BPM
规则引擎
架构师观点
数据工程
产品经理
系统思维
微服务
微服务介绍
微服务专辑
模块化设计
SOA
API设计
clean架构
SpringBoot
分布式事务
分布式架构
Kubernetes
DevOps
编程设计
GoF设计模式
模式专辑
面向对象
函数式编程
编程语言比较
编程工具比较
形式逻辑
前端编程
Reactive编程
Jdon框架
Rust语言
ChatGPT
Web3
模因梗
幽默梗
程序员吐槽
面试技巧
Java入门
数字化转型
认知偏差
道德经
GitHub工具
更多话题
HuggingFace在NLP和计算机视觉中的应用 - Reddit
22-04-20
banq
你想做语义分割吗?查看
https://huggingface.co/blog/fine-tune-segformer
。
图像分类?
https://huggingface.co/blog/fine-tune-vit
。
您可以查看
https://github.com/huggingface/transformers/tree/main/examples/pytorch
以查找用于语义分割、图像分类、图像预训练等的示例脚本!
您可以使用 ``datasets`` 轻松推送或下载图像数据集,例如在
https://huggingface.co/blog/image-search-datasets
中。
ConvNeXT (
https://huggingface.co/docs/transformers/model_doc/convnext
), ResNET (
https://huggingface.co/docs/transformers/main/en/model_doc/resnet
), Vision Transformer (
https://huggingface .co/docs/transformers/model_doc/vit
),ImageGPT(
https://huggingface.co/docs/transformers/main/en/model_doc/imagegpt
),PoolFormer(
https://huggingface.co/docs/transformers/main /en/model_doc/poolformer
)和许多其他模型
架构
,包括多模态模型,例如 Perceiver (
https://huggingface.co/docs/transformers/main/en/model_doc/perceiver
)。
甚至可以使用交互式演示直接在浏览器中玩模型
https://huggingface.co/spaces/akhaliq/poolformer
深度估计
https://huggingface.co/spaces/nielsr/dpt-depth-estimation
视觉问答
Hugging Face 为许多模型和数据集提供计算机视觉支持!ViT、DeiT、DETR 等模型以及文档解析模型也可用。在 HF 模型集线器上,也有很多专注于视觉的任务(所有任务请参见左侧选择器):
https ://huggingface.co/models
更详细地说,目前支持以下任务:
图像分类:ViT、DeiT、BEiT、Swin Transformer、PoolFormer、ResNet、RegNet、ConvNeXT、Perceiver、ImageGPT、VAN。查看官方
示例脚本
、
示例笔记本
。
物体检测:DETR,很快 YOLOS。查看右侧的
推理小部件。
语义分割:SegFormer、BEiT、DPT => 查看
示例脚本
深度估计:DPT、GLPN。看看这个
演示空间
。
所有模型都可以在
https://huggingface.co/docs/transformers/index
找到。
更多教程可以在
https://github.com/NielsRogge/Transformers-Tutorials
找到。
https://github.com/rwightman/pytorch-image-models
机器学习
NLP自然语言处理
计算机视觉