免费的 Gemini Pro API 用法大全 「智图派」

免费的 Gemini Pro API 用法大全 「智图派」

视频中的链接:

Google 开发者官网:Build with the Gemini API  |  Google AI for Developers

Gemini Discord Bot:clairelovesgravy/discord-bot-gemini: introducing gemini to discord

Replit 官网: https://replit.com/

如何访问官网

目前是免费,但是限制每分钟 60 个查询。这对于一般应用足够了。

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-20at23-07-56-5.png
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at13-14-46-5.png

无论选择任何一项,都会进入到 Google AI Studio,只不过是打开了不同的菜单项。在下一幅图片中就可以看到。

虽然是使用的 API,但由于是免费使用,因此你的输入输出将会被用于训练,这就是免费的代价。

进入 Google AI Studio 后,主界面为:

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at13-31-16-5.png

所以,如果你在开始界面,选了「Get API Key」就等同于选择左侧菜单的「Get API Key」,如果选了「New Prompt」就等同于选择左侧菜单的「Create New」

我们接下来先看以下如何直接在 Google AI Studio 的环境中使用 Gemini Pro,然后再说使用 API Key 在你自己的环境中使用的方法。

如何在 Google AI Studio 中使用 Gemini Pro

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at13-44-54-5.png

AI Studio 提供了三种创建提示的方法来使用 Gemini Pro,分别是 Freeform Prompts,自由形式的提示、Structured Prompts 结构化提示和 Chat Prompts 聊天提示。根据 Google 的帮助文档,对三种形式的解释如下:

Freeform prompts 自由形式提示 - 这些提示提供了一个开放式的提示体验,用于生成内容和响应指令。您可以使用图像和文本数据作为提示。

Structured prompts 结构化提示 - 这种提示技术允许您通过提供一组示例请求和回复来引导模型输出。在您需要对模型输出的结构有更多控制时,请使用此方法。了解更多信息。

Chat prompts 聊天提示 - 使用聊天提示来构建对话式体验。这种提示技术允许多次输入和响应来生成输出。

看完后,我只能说我理解了什么是结构化提示,但是对于自由形式的提示和聊天提示,搞不懂 Google 在说什么。除了界面不同,难道区别在于聊天提示才支持多次输入和响应吗?

实际当然不是这样的,不看不知道,看了之后才发现,还是很有意思的。我们分别来看一下不同提示的方式吧。

Freeform Prompts 自由提示

基本功能

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-43-26-4.png
  • Freeform Prompts 的模型可以选择 Gemini Pro 以及 Gemini Pro Vision,顾名思义,Gemini Pro Vision 支持图片。但是让我好奇的是,Gemini 不是原生多模态吗?为什么还要分出一个 Vision 版本呢?
  • 如果没有图片,只能选择 Gemini Pro。换句话说,选择 Gemini Pro Vision 必须给图片 PROMPT。
  • Temperature 和 Top P 参数在我的『AI 实战派』课程当中都讲过,不再赘述。
  • 对于 PROMPT 的尺寸是有限制的:
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-52-41-4.png
  • 文字识别功能,对于格式不规则的文本,识别能力欠佳
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-55-23-4.png
  • 看看老对手的表现:
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at18-05-27-4.png
  • 只能说,对于格式不规范的中文识别,效果都差强人意。GPT-4 稍好些。
  • 对于格式规则的文本,识别能力一流
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-56-59-4.png

设置变量

可以通过 Test Input 设置变量,并可以给变量多次赋值后批量执行。

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-20at00-39-09-4.png

参数:

以下是“Add stop sequence - Truncate response including and after string”参数的使用示例:

  • 在响应主体中,遇到特定标签或标记的第一次出现后停止读取响应流。
  • 通过将参数设置为预期在所需截断点发生的字符串,将响应流截断为特定大小。
  • 通过在接收到一定量数据后截断响应流来处理大型响应。

Structured prompts 结构化提示

Google AI Studio中的结构化提示可以帮助您做到这一点 - 将指令与示例结合起来,向模型展示您想要的输出类型,而不仅仅告诉它要做什么。

Read more

对 OpenAI 的诉讼揭示的 AI 悖论 | ChatGPT 网页版推出语音功能 | AI 快讯20240304

对 OpenAI 的诉讼揭示的 AI 悖论 | ChatGPT 网页版推出语音功能 | AI 快讯20240304

点击进入「AI 精英学院」,做一个会 AI 的人- 开源三国之 Gemma:Google 最强开源模型 Gemma 能打吗? - 埃隆·马斯克对OpenAI的诉讼揭示的悖论 - 人形机器人初创公司Figure AI获 OpenAI 投资,估值达26亿美元 - Copilot for OneDrive:为您获取和总结文件 - ChatGPT 网页版推出语音功能 - 新计算机蠕虫威胁ChatGPT和Gemini等AI模型 开源三国之 Gemma:Google 最强开源模型 Gemma 能打吗? 最新视频探讨了以下内容: * Gemma 开源家族的两大特色 * 两种开箱即用的使用 Gemma 的方式 * 三种模型编码能力对比测试 * 两种本地部署 Gemma 的方法 * 为什么本地部署开源模型的用途不大? 点击以下链接观看视频: https:

By Axton
今日主角:Mistral Large 模型以及如何尝鲜  | AI 快讯20240228

今日主角:Mistral Large 模型以及如何尝鲜 | AI 快讯20240228

点击进入「AI 精英学院」,做一个会 AI 的人- Mistral AI发布最新旗舰语言模型Mistral Large - 如何免费尝鲜 Mistral Large - 微软与Mistral建立多年合作伙伴关系 - 我们是否都应该在大脑中植入芯片 Mistral AI发布最新旗舰语言模型Mistral Large 原文链接:Mistral Large Mistral AI最近发布了其最新且最先进的语言模型Mistral Large,这是一款具备顶尖推理能力的旗舰模型,通过la Plateforme提供,也是首个通过Azure分发的模型。 Mistral Large在多语言推理任务上展现出卓越性能,包括文本理解、转换和代码生成,使其成为继GPT-4后,通过API通用可用的世界第二大模型。该模型天生流利于英语、法语、西班牙语、德语和意大利语,能够精确回忆大型文档中的信息,且具备精确的指令遵循能力。 与Microsoft Azure的合作,进一步扩展了Mistral Large的应用范围,包括应用开发和技术栈现代化。此外,Mistral AI还推出了针对低延迟工作负载优化的Mis

By Axton
一次处理 80 万汉字,Gemini 1.5 Pro 值得期待吗 「智图派」

一次处理 80 万汉字,Gemini 1.5 Pro 值得期待吗 「智图派」

虽然 OpenAI 的 Sora 火遍全网,吸引了大家的眼球,但是不要忽略了,Gemini 1.5 的突破性进展带来的深远影响。这甚至比 Sora 都更有意义。 Gemini 1.5 相比 Gemini 1.0,虽然只是半个版本号的变化,增加了 0.5,但是在性能方面具有很大的改进,以至于达到了 1.0 Ultra 版本的能力,但是消耗的算力却更少。 我们知道,Gemini 分为三个版本,其中 Pro 是中档版本,而 Ultra 是高级版。1.0 Ultra 是与 GPT-4 对标的,因此可以说,Gemini 1.

By Axton
OpenAI 神秘网站露面 | 苹果的未来可穿戴设备展望 | AI 快讯20240226

OpenAI 神秘网站露面 | 苹果的未来可穿戴设备展望 | AI 快讯20240226

点击进入「AI 精英学院」,做一个会 AI 的人- OpenAI 神秘网站 Feather 露面 - 泰勒·派瑞因Sora暂停8亿美元工作室扩建计划 - 苹果测试ChatGPT式AI工具“Ask” - 苹果的未来可穿戴设备展望:智能眼镜与带摄像头的AirPods - 揭示生成式AI的脆弱性:以ChatGPT最近的胡言乱语崩溃为例 OpenAI 神秘网站 Feather 露面 输入 feather.openai.com 会进入 OpenAI 的 Feather 网站,目前尚不确定具体内容,搜索结果表示: 据说,OpenAI 在2023年11月注册了 OpenAI Feather 商标。 泰勒·派瑞因Sora暂停8亿美元工作室扩建计划 原文链接:The Hollywood Reporter 泰勒·

By Axton