「智图派」

免费的 Gemini Pro API 用法大全「智图派」

Axton

25 Dec 2023 — 15 min read

视频中的链接：

Google 开发者官网：Build with the Gemini API | Google AI for Developers

Gemini Discord Bot：clairelovesgravy/discord-bot-gemini: introducing gemini to discord

Replit 官网： https://replit.com/

如何访问官网

目前是免费，但是限制每分钟 60 个查询。这对于一般应用足够了。

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-20at23-07-56-5.png

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at13-14-46-5.png

无论选择任何一项，都会进入到 Google AI Studio，只不过是打开了不同的菜单项。在下一幅图片中就可以看到。

虽然是使用的 API，但由于是免费使用，因此你的输入输出将会被用于训练，这就是免费的代价。

进入 Google AI Studio 后，主界面为：

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at13-31-16-5.png

所以，如果你在开始界面，选了「Get API Key」就等同于选择左侧菜单的「Get API Key」，如果选了「New Prompt」就等同于选择左侧菜单的「Create New」

我们接下来先看以下如何直接在 Google AI Studio 的环境中使用 Gemini Pro，然后再说使用 API Key 在你自己的环境中使用的方法。

如何在 Google AI Studio 中使用 Gemini Pro

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at13-44-54-5.png

AI Studio 提供了三种创建提示的方法来使用 Gemini Pro，分别是 Freeform Prompts，自由形式的提示、Structured Prompts 结构化提示和 Chat Prompts 聊天提示。根据 Google 的帮助文档，对三种形式的解释如下：

Freeform prompts 自由形式提示 - 这些提示提供了一个开放式的提示体验，用于生成内容和响应指令。您可以使用图像和文本数据作为提示。

Structured prompts 结构化提示 - 这种提示技术允许您通过提供一组示例请求和回复来引导模型输出。在您需要对模型输出的结构有更多控制时，请使用此方法。了解更多信息。

Chat prompts 聊天提示 - 使用聊天提示来构建对话式体验。这种提示技术允许多次输入和响应来生成输出。

看完后，我只能说我理解了什么是结构化提示，但是对于自由形式的提示和聊天提示，搞不懂 Google 在说什么。除了界面不同，难道区别在于聊天提示才支持多次输入和响应吗？

实际当然不是这样的，不看不知道，看了之后才发现，还是很有意思的。我们分别来看一下不同提示的方式吧。

Freeform Prompts 自由提示

基本功能

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-43-26-4.png

Freeform Prompts 的模型可以选择 Gemini Pro 以及 Gemini Pro Vision，顾名思义，Gemini Pro Vision 支持图片。但是让我好奇的是，Gemini 不是原生多模态吗？为什么还要分出一个 Vision 版本呢？
如果没有图片，只能选择 Gemini Pro。换句话说，选择 Gemini Pro Vision 必须给图片 PROMPT。
Temperature 和 Top P 参数在我的『AI 实战派』课程当中都讲过，不再赘述。
对于 PROMPT 的尺寸是有限制的：

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-52-41-4.png

文字识别功能，对于格式不规则的文本，识别能力欠佳

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-55-23-4.png

看看老对手的表现：

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at18-05-27-4.png

只能说，对于格式不规范的中文识别，效果都差强人意。GPT-4 稍好些。
对于格式规则的文本，识别能力一流

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-56-59-4.png

设置变量

可以通过 Test Input 设置变量，并可以给变量多次赋值后批量执行。

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-20at00-39-09-4.png

参数：

以下是“Add stop sequence - Truncate response including and after string”参数的使用示例：

在响应主体中，遇到特定标签或标记的第一次出现后停止读取响应流。
通过将参数设置为预期在所需截断点发生的字符串，将响应流截断为特定大小。
通过在接收到一定量数据后截断响应流来处理大型响应。

Structured prompts 结构化提示

Google AI Studio中的结构化提示可以帮助您做到这一点 - 将指令与示例结合起来，向模型展示您想要的输出类型，而不仅仅告诉它要做什么。

测试用 Make.com 手搓一个 Deep Research

Grok 3真的具备推理能力吗？面对免费开放的最强AI，我们该如何应对？近几个月来，人工智能领域发生了翻天覆地的变化。继OpenAI、Google和Anthropic等科技巨头推出一系列强大模型之后，Elon Musk的AI初创公司xAI再次引爆舆论——全新推出的Grok 3号称是“最强AI”，不仅在性能上大幅超越自家Grok 2，更以免费开放的策略引发了业内外的广泛讨论。本文将深入剖析Grok 3的诞生背景、技术架构、性能表现以及它在推理能力上的真正实力，同时探讨这种免费策略对竞争格局的可能影响，并展望未来AI技术的发展趋势和面临的挑战。 1. 引言：Grok 3的诞生与市场冲击 1.1 Grok 3简介与推出背景 Grok 3是xAI最新发布的人工智能模型，其诞生背景充满戏剧性与战略考量。早在2015年，Elon Musk即曾参与创办OpenAI，但随着时间的推移，Musk对于OpenAI偏离初衷、走向商业化的趋势产生了诸多不满，从而在2023年另起炉灶成立了xAI。Musk在其直播演示中表示，Grok 3在计算力、推理能力以及数据支撑上都实现了质的飞跃，不仅较上一代

test

this is a tes

Napkin AI: 一键生成专业图表

主题 Napkin AI 工具介绍与使用教程：详细介绍了 Napkin AI 这款能将文本转化为专业图表的工具，并提供了实际操作指南。 AI 辅助内容创作与可视化：探讨了如何利用 AI 工具（如 NotebookLM 和 Napkin AI）来总结视频内容并将其转化为视觉吸引力强的图表。专业图表在商业展示中的重要性：讨论了高质量图表在商业咨询和演示中的关键作用。核心要点 * Napkin AI 能将文本自动转化为专业级别的图表，大大提高了内容创作和演示的效率。 * 该工具提供了丰富的自定义选项和高级功能，如 Spark Search 和协作功能，满足不同用户的需求。 * Napkin AI 的出现可能会降低高质量商业展示的成本门槛，使普通用户也能制作出专业水准的图表。 * 尽管目前还处于测试阶段，Napkin AI 展现出了巨大的潜力，预示着内容创作和信息可视化领域的变革。洞见 Napkin AI 代表了一种新兴的"专业技能"趋势。

Claude 新功能超越 ChatGPT？

主题 Claude最新数据分析功能发布与ChatGPT对比: 详细介绍了Claude新推出的数据分析功能，并与ChatGPT的高级数据分析功能进行了对比测试。 AI公司之间的竞争: 分析了Anthropic(Claude)和OpenAI(ChatGPT)在功能更新方面的竞争态势。大型语言模型的数据处理能力: 探讨了Claude和ChatGPT在处理不同规模数据文件时的表现和局限性。核心要点 * Claude新推出的数据分析功能能够处理CSV文件并生成交互式图表，展示了大语言模型在数据科学领域的应用潜力。 * Anthropic通过连续推出新功能，包括数据分析工具，似乎在直接挑战OpenAI的市场地位，反映了AI公司间激烈的竞争态势。 * 虽然Claude在图表交互性和视觉效果上表现出色，但在数据处理能力和全面性上仍落后于ChatGPT的高级数据分析功能。 * 大型语言模型正在向多功能、集成化方向发展，不再局限于纯文本处理，而是扩展到数据分析、可视化等领域。洞见 AI公司间的功能竞争正在推动"AI即服务"(AIaaS)生态系统的快速演变。随着像Claude