JVM的开源大语言模型简介


下面介绍的四个项目,每个项目都与语言模型有一些联系:

VertexAI-kt
虽然OpenAI和ChatGPT经常主导公众的意识,但其他参与者也提供了他们独特的解决方案。谷歌的Vertex AI就是一个典型的例子。

这是一个全面的机器学习平台,已经开发了多年(还记得谷歌是 "人工智能公司 "的代名词吗?),现在它增强了对LLM和生成性人工智能的支持。

这个平台包括PaLM 2(相当于OpenAI的GPT)、Imagen(文本到图像模型)和Codey等高级模型,这是谷歌对GitHub的Copilot的回应。例如,GitLab分享了它如何采用Codey作为其 "解释这个漏洞 "功能的例子。

另一方面,hexascribe/vertexai-kt是一个Kotlin多平台库,专门用于简化与Vertex AI API的整合,全部为Kotlin定制。

尽管VertexAI-kt主要面向移动应用,但它的共同部分应该适用于几乎任何项目,包括服务器端的项目。毕竟,MultiPlatform意味着MultiPlatform,而不是MultiMobileOS。

但如果你正在构建自己的移动应用程序,同一个组织在其存储库中也有一套基于Kotlin的多平台组件,用于轻松创建基于OpenAI的聊天机器人 - hexascribe/chatbot-builder。

langchain4j
LangChain是由Harrison Chase开发的一个框架,迎合了大型语言模型(LLM)的需求。在OpenAI的GPT-3取得巨大成功后,它的受欢迎程度激增,可以说,GPT-3.5和GPT-4更是如此。2022年10月底推出的LangChain利用了这些进展,提供了一个专门用于创建依赖LLM的生产级应用程序的平台,而不仅仅是实验性的。

LangChain的关键理念是将不同的部件连接或 "链条 "在一起,形成复杂的应用。这些链子可以使用许多模块的碎片,如各种提示的模板(如聊天回复、ELI5等)、与不同LLM模型的连接(如GPT-3、BLOOM等)、代理(使用LLM来决定做什么--我们今天晚些时候将讨论gpt-engineer项目在这个类别中的情况)以及记忆(短期和长期)。所有这些都是以标准应用框架的形式提供的。

langchain4j/langchain4j则是langchain的一个Java封装器--一个类固醇。整个项目已经在引导用户,并专注于清楚地展示使用的可能性(在项目中你会发现一个带有例子的目录),并且创造者宣布进一步的发展。


midjourney-proxy
虽然前面两个项目可能没有什么印象,但可以说,任何没有完全失去联系一年的人都可能对Midjourney感到熟悉。

有许多制作图像的LLM......但Midjourney在其中脱颖而出。你的想法可能会有所不同,但在我看来,无论是稳定扩散还是达勒项目都无法与Midjourney相提并论--即使像我这样的新手也能取得令人印象深刻的成果。

尽管如此,Midjourney确实有一个限制--它缺乏一个API。与这个项目互动的唯一界面是Discord,在那里用一个机器人来生成图像。但是很明显,非官方的往往会填补官方解决方案缺失的空白。

这就是今天的第三个项目,novicezk/midjourney-proxy发挥作用的地方。它是一个 "粉丝制造 "的API,有源代码和Docker镜像。这需要一个授权密钥,可以从Discord的请求头中获得,并通过提供相关的端点和挂钩来促进镜像的生成。我们可以使用这些来检查一个图像是否已经被创建(Midjourney使用异步通信)。

存储库和它的所有文档都是用中文.的。

Chat2DB
这是由阿里巴巴带来的SQL数据库客户端。

chat2db/Chat2DB包括与OpenAI的整合(文档中甚至建议了从中国境内通过VPN连接的方法)。这一功能允许将自然语言转换为SQL语言,反之亦然,有可能大大提升开发者的生产力。

如尝试在类似ChatGPT的界面中生成SQL查询,我发现这相当有益。同时,除了API集成外,该软件还容纳了数据管理等 "传统 "功能,并支持各种数据库类型--MySQL、PostgreSQL、Oracle等,并有进一步扩展的前景。

先进的功能包括一个智能人工智能助手,帮助查询转换和SQL优化。此外,Chat2DB支持团队合作,通过消除开发人员对在线数据库密码的了解,确保企业数据库账户的安全性。该程序支持多种数据库,包括MySQL、PostgreSQL、Oracle和其他数据库,未来还有可能扩展。