13种Gemini 1.5和GPT-4o使用案例


谷歌和 OpenAI 正在开战,短短几天内,两家公司都推出了两款极其强大的多模态 AI:Gemini 1.5 和 GPT-4o。

谁拥有最好的大模型?我们举办了一场紧急黑客马拉松来一探究竟。

1、电梯游说

  • Gemini 1.5 最佳:Gemini 1.5 多模式音频对电梯游说提供反馈,极其详细的分析——甚至理解语气、激情和信念

电梯游说是对您或您的公司所做工作的简洁、令人难忘的描述,旨在激发听众的兴趣。有效的电梯游说的关键方面是:

  • 它应该很简短,大约 30 秒到 1 分钟长,因为它旨在在乘坐电梯的短时间内传达您的核心信息。
  • 它应该用简单、无行话的语言清楚地解释您/您的公司的业务以及您提供的价值。
  • 它应该用一个有趣的钩子来吸引听众的注意力,比如问题、统计数据或独特的观点。
  • 它应该以号召性用语结束,例如请求举行后续会议或交换联系信息。
  • 我们应该自信而自然地练习和表达。

目的不是推销或说服,而是激发好奇心并为进一步对话打开大门。一些很好的电梯推介示例:
  • “我是 Apollo Enterprises 的 Kelly。我们能够提高全球团队的生产力和协作能力。如果您需要项目管理方面的帮助,请联系我们。”
  • “您的老板是否曾要求您在一天结束之前快速完成一份报告?AnswerASAP 将您的所有数据放在一个地方,以便在 30 秒内创建独特的报告。”

有效的电梯游说可以让您快速但令人难忘地介绍自己和您的业务,从而引起听众的兴趣。

2、生成式用户体验
交互式旅行社,将用户偏好与旅行指南、预订、照片、费用规划等联系起来


3、OpenRabbit - 最佳计算机视觉应用
使用本地硬件开源 Rabbit R1。它可以:

  • - 使用 Suno 创作音乐
  • - 发电子邮件
  • - 精选播放列表

和更多

更好的 R1,但 24 小时内就制造完成

3、合成
使用 GPT-4o 和 Gemini 1.5 为较小的机器学习任务生成合成数据集

4、GPT-4o 的最佳用途
在 WhatsApp 市场上与食品商贩和供应商谈判的人工智能代理每月为餐厅节省数百美元,采购更便宜、更优质的食材

5、机器人辩论赛
GPT-4o 和 Gemini 1.5 在现场观众面前辩论——但观众不知道谁是谁。 观众投票选出获胜者

6、Engineer-4o :
VSCode插件代理可自动跟踪问题并解决代码库问题

7、HotAgents :
桌面代理可以截取屏幕截图并确定要自动调用哪些工具。它可以总结文本、编写代码等 只需一个热键即可

8、人工智能代理将用户请求与 GPS 位置相结合,规划独特的个性化旅游体验

9、人工智能助手可以听取你的笔记,创建可编辑的实时记录,并向你发送电子邮件摘要

10、更好的 Siri 语音助手,用于管理待办事项和日历事件

11、经过计算机视觉驱动的机器狗可识别物体

12、将您的 Twitter 信息变成报纸 Web Scraper 打开浏览器,解析您的 feed,并将其转换为 1 页。

13、AI语音克隆,与你的个人信息同步,成为你的同步克隆