免费的 Gemini Pro API 用法大全 「智图派」

免费的 Gemini Pro API 用法大全 「智图派」

视频中的链接:

Google 开发者官网:Build with the Gemini API  |  Google AI for Developers

Gemini Discord Bot:clairelovesgravy/discord-bot-gemini: introducing gemini to discord

Replit 官网: https://replit.com/

如何访问官网

目前是免费,但是限制每分钟 60 个查询。这对于一般应用足够了。

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-20at23-07-56-5.png
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at13-14-46-5.png

无论选择任何一项,都会进入到 Google AI Studio,只不过是打开了不同的菜单项。在下一幅图片中就可以看到。

虽然是使用的 API,但由于是免费使用,因此你的输入输出将会被用于训练,这就是免费的代价。

进入 Google AI Studio 后,主界面为:

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at13-31-16-5.png

所以,如果你在开始界面,选了「Get API Key」就等同于选择左侧菜单的「Get API Key」,如果选了「New Prompt」就等同于选择左侧菜单的「Create New」

我们接下来先看以下如何直接在 Google AI Studio 的环境中使用 Gemini Pro,然后再说使用 API Key 在你自己的环境中使用的方法。

如何在 Google AI Studio 中使用 Gemini Pro

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at13-44-54-5.png

AI Studio 提供了三种创建提示的方法来使用 Gemini Pro,分别是 Freeform Prompts,自由形式的提示、Structured Prompts 结构化提示和 Chat Prompts 聊天提示。根据 Google 的帮助文档,对三种形式的解释如下:

Freeform prompts 自由形式提示 - 这些提示提供了一个开放式的提示体验,用于生成内容和响应指令。您可以使用图像和文本数据作为提示。

Structured prompts 结构化提示 - 这种提示技术允许您通过提供一组示例请求和回复来引导模型输出。在您需要对模型输出的结构有更多控制时,请使用此方法。了解更多信息。

Chat prompts 聊天提示 - 使用聊天提示来构建对话式体验。这种提示技术允许多次输入和响应来生成输出。

看完后,我只能说我理解了什么是结构化提示,但是对于自由形式的提示和聊天提示,搞不懂 Google 在说什么。除了界面不同,难道区别在于聊天提示才支持多次输入和响应吗?

实际当然不是这样的,不看不知道,看了之后才发现,还是很有意思的。我们分别来看一下不同提示的方式吧。

Freeform Prompts 自由提示

基本功能

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-43-26-4.png
  • Freeform Prompts 的模型可以选择 Gemini Pro 以及 Gemini Pro Vision,顾名思义,Gemini Pro Vision 支持图片。但是让我好奇的是,Gemini 不是原生多模态吗?为什么还要分出一个 Vision 版本呢?
  • 如果没有图片,只能选择 Gemini Pro。换句话说,选择 Gemini Pro Vision 必须给图片 PROMPT。
  • Temperature 和 Top P 参数在我的『AI 实战派』课程当中都讲过,不再赘述。
  • 对于 PROMPT 的尺寸是有限制的:
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-52-41-4.png
  • 文字识别功能,对于格式不规则的文本,识别能力欠佳
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-55-23-4.png
  • 看看老对手的表现:
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at18-05-27-4.png
  • 只能说,对于格式不规范的中文识别,效果都差强人意。GPT-4 稍好些。
  • 对于格式规则的文本,识别能力一流
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-56-59-4.png

设置变量

可以通过 Test Input 设置变量,并可以给变量多次赋值后批量执行。

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-20at00-39-09-4.png

参数:

以下是“Add stop sequence - Truncate response including and after string”参数的使用示例:

  • 在响应主体中,遇到特定标签或标记的第一次出现后停止读取响应流。
  • 通过将参数设置为预期在所需截断点发生的字符串,将响应流截断为特定大小。
  • 通过在接收到一定量数据后截断响应流来处理大型响应。

Structured prompts 结构化提示

Google AI Studio中的结构化提示可以帮助您做到这一点 - 将指令与示例结合起来,向模型展示您想要的输出类型,而不仅仅告诉它要做什么。

Read more

Jina Reader API 的四种用法 | 「智图派」

Jina Reader API 的四种用法 | 「智图派」

构建知识库,或者分析各种文章数据,是大家使用 AI 很重要的一个应用场景,因此我们常常会需要用到爬虫去爬取某个网站上的内容,现在,Jina 推出了一款非常简单好用的获取网页内容的工具,你只要把网址给它,它就能把网页内容整理成很适合大语言模型使用的格式,简直是构建知识库的利器。今天我就给大家介绍四种用法。分别包括在自动化工作流中使用以及在 AI 智能体中使用。 Jina Reader API 的网址是 读取器 API,你可以直接输入你需要爬取内容的网址 URL 在这边进行测试,输入之后直接点击按钮「获取内容」,就可以在右边得到结果了。 而他的用法也很简单,就是把你需要爬取内容的网页的 URL 写在 https://r.jina.ai 的后面就可以了。 什么是 Reader API Reader 是将任何URL转换为LLM友好的输入,只需简单添加前缀 https://r.jina.ai/ 无需付费即可获得改进后的适用于智能体或 RAG 系统的输出。

lock-1 By Axton
Coze 工作流获取 Tweets 详解 | 「智图派」

Coze 工作流获取 Tweets 详解 | 「智图派」

Coze是一个可以不用代码来搭建AI聊天机器人的平台。我在这期视频当中已经详细地讲解了Coze的各种功能,以及如何用到GPT-4 Turbo的模型。感兴趣的朋友可以回看一下。 自从 Twitter 被马斯克买了之后,如果你想从 Twitter 网站的外面来获取推文信息,也就是用 Twitter API,就需要每个月充值100美元了。但是 Coze 却很大方地让你可以免费地用部分 Twitter API 的功能了。今天我就先给大家演示一个可以批量获取多个 Twitter 作者的推文的工作流,把这个工作流嵌入到你的 AI 聊天机器人里面。比如我这里加了两个 Twitter 账号,我的和马斯克的,这样就可以一次性地获取到我们两个人的推文了。 今天我首先给大家演示一下在 Coze 上可以用到的 Twitter API 的功能,然后再演示一下批量获取推文的工作流,最后我们再聊一聊 Coze 的局限性。 Plugins 的基本功能 getUsers 首先第一个 "get users"

lock-1 By Axton
建立微信 AI 工作流 | 支持 10000 个文件,Assistants API v2 发布 | AI 快讯20240418

建立微信 AI 工作流 | 支持 10000 个文件,Assistants API v2 发布 | AI 快讯20240418

点击进入「AI 精英学院」,做一个会 AI 的人- 新视频发布:微信如何通过 Make 与 GPT、Claude、知识库无缝集成 - 支持 10000 个文件,Assistants API v2 发布 - 我们需要为生物技术的“ChatGPT时刻”做好准备 - NVIDIA推出基于安培架构的两款新GPU,RTX A400和RTX A1000 - Google地图将利用AI帮助您找到隐蔽的电动车充电器 微信如何通过 Make 与 GPT、Claude、知识库无缝集成 没想到海外的自动化平台居然也支持微信公众号。Make 工作流自动化平台,不但支持微信,还支持的挺完善,确实有些让人意外。本期视频演示如何使用 Make 获取微信公众号信息、与 OpenAI 知识库联动、

By Axton
DALL.E 推出图像编辑以及风格推荐功能 | Sora 再现竞争对手 | AI 快讯20240404

DALL.E 推出图像编辑以及风格推荐功能 | Sora 再现竞争对手 | AI 快讯20240404

点击进入「AI 精英学院」,做一个会 AI 的人- DALL.E 推出图像编辑以及风格推荐功能 - “多次尝试破解”:实验室揭示AI安全特性如何被轻松绕过 - 前Snap AI负责人推出Higgsfield,挑战OpenAI的Sora - MIT研究人员开发新计算技术以简化蛋白质工程化过程 使用DALL·E编辑图片 原文链接:Editing your images with DALL·E | OpenAI Help Center OpenAI 的推文包含两项功能的视频演示: You can also get inspiration on styles when creating images in the DALL·E GPT. pic.twitter.com/

By Axton