• Marker 将 PDF、EPUB 和 MOBI 转换为 Markdown。它比 nougat 快 10 倍,比 arXiv 更准确,而且幻觉风险很低。 Marker 针对吞吐量进行了优化,比如转换 LLM 预训练数据。在大多数文档上更准确,并且产生幻觉的风险较低。 支持一系
  • 为 Quants(定量金融)提供的超棒库、软件包和资源的精选列表 语言包括: icon
  • 有趣的项目、工具和库 gpt-crawler抓取网站以生成知识文件,从而从 URL 创建您自己的 icon
  • 这是基于量化金融领域不同主题的Jupyter notebooks合集。 这是量化算法的集合:包含了一些现在不那么流行的主题,但它们可能非 icon
  • Github有趣的项目、工具和库: 1、sshx一个基于 Web 的安全协作终端 icon
  • 开源世界地图可作为单个静态文件用于低成本托管 Protomaps 是一种开源的世界地图,可以作为单个静态文件部署在云存储上。它使用压缩的希尔伯特排序和 HTTP Range Requests(HTTP 范围请求)以高效的方式交付地图图块。 icon
  • Dilithium 是一种实验性后量子数字签名算法,是美国国家标准与技术研究院标准化的三个决赛入围算法之一。 此实现为 Dilithium 提供了 Java 加密提供程序,允许通过标准 Java 加密扩展接口使用它。 它支持为 Dilithium 指定的所有三个安全级 icon
  • 这是李开复的AI公司开发的人工智能模型,该公司在不到一年的时间里就获得了 10 亿美元估值。 Yi系列模型是由01.AI的开发人员从头开始训练的大型 icon
  • Ladder 开源代理是帮助用户绕过新闻网站上的付费墙。 虽然媒体组织拥有合法的经济利益,但付费墙可能会限制信息获取,从而破坏开放和知情社会的原则。 Ladder 是 12ft.io 等服务的替代方案,旨 icon
  • Flyscrape是一个用 Go 编写的开源网络抓取工具。它允许使用 JavaScript 脚本从网站中提取结构化数据。Flyscrape 专为速度、灵活性和简单性而设计。 特点: 它作为独立的二进制文件运行,专注于数据提取而不是请 icon
  • 本周Github有趣的项目、工具和库包: 1、VoyagerVoyager icon
  • AtomVM是一个用于 IoT 物联网设备的 Erlang 虚拟机,具有轻量级 BEAM 实现和针对微控制器优化的标准库。 AtomVM是将Erlang、Elixir和其他函数式语言引入非常小的系统。 A icon
  • Github有趣的项目、工具和库 AIConfig配置驱动、源代 icon
  • OAuth/OAuth2 很难?配置 ScribeJava 非常简单,您的奶奶也能做到。 使用 LinkedIn 的 OAuth API 配置 ScribeJava 时,只需这一行(添加换行符以提高可读性): icon
  • Github有趣的项目、工具和库 1、RadiusRadius 是一个开源云原生应用程序平台,使开发人员和 icon
  • 有趣的Github项目、工具和库 OmnigresOmnigres 使 Postgres 成为开发人员优 icon
  • icon