AI 突发:Midjourney 重磅更新 V5.2

Midjourney 22日推出更新版本,V5.2。详细更新内容在本邮件末尾。咱们先说两个最让我惊艳的新功能。

测试所用的 Prompt 来自 Midjourney 社区,是一个极其复杂的 Prompt,翻译成中文为:

山岳熔岩规格高级时装 | 由Subterfugitive制作 ::0 在夜晚的月光下,一个神奇的熔融景观,生物发光的火山花朵,金继修补熔岩岩石,生物发光的蘑菇,花朵庞克、黑暗盛开核心、浅景深、余辉漫舞、超极致主义、超详细背景 ::4 遥远散落的多个拉瓦洛克避难所窗户中温暖橙色灯光 ::2 前景中面向相机戴着头饰的年轻成年女子,她有着大而宽阔的眼睛和生物发光机械复杂纤维仪器眼植入体,并佩戴完美圆形透明全息技术护目镜显示器 ::5 一位优雅迷人的女士穿着精美华丽手工打造的熔化高级定制洛可可靴子和紧身微钩爪裹身服装以及华丽最大限度头饰和技术护目镜,在其周围环境内容和质地上完美融合了超极致主义、超详细、熔岩庞克生物发光花朵盛开核心 ::5 森林中的花朵,余辉漫舞 ::3 倾斜移位,f/64数码单反相机,逼真效果,超现实主义,射线追踪阴影和反射,虚幻引擎,Octane渲染器数字时装摄影、电影般的写实感觉、泡沫半透明皮肤、自然采光不对称构图 ::4 工艺美术, 对称性, 居中对齐 ::-1 --ar 4:5 --q 2 --c 40 --s 1000

缩小

当然,也会出现意外:

精简 Prompt

这让您可以“分析”提示,并获得有关哪些单词可能没有作用以及哪些单词可能是关键的建议。

这才是我最期待的功能啊,毕竟前面的“缩小”功能其实类似于Adobe的Generative Fill。

以下是5个大幅精简后的Prompt生成的图片,你们觉得怎么样?


掌握核心 AI 技能,探索前沿科技,进入 👇

V5.2中有什么新内容?

新的美学系统

改进了美学效果和图像清晰度
略微改善了连贯性和文本理解
增加了多样性(有时候你可能需要多试几次才能得到你想要的结果,抱歉!)
修复了--stylize命令,以强烈影响应用于您的图像的风格化程度(更像V3版本)。此命令的取值范围是--stylize 0 到 --stylize 1000,其默认值是--stylize 100

新的"高变异模式"

默认启用,使所有变异任务更加多变。
要切换此模式,请输入/settings,然后点击不同的变异模式。
在所有的放大功能下,您也可以选择您想要的变异强度。

新的/shorten命令

这个命令可以让你'分析'一个提示,并得到哪些词可能没有什么作用,哪些词可能是关键的建议。

新的"缩小"功能

现在所有的放大功能都在下方增加了'缩小'按钮,你可以用来重新构框图像
[缩小1.5倍] [缩小2倍] 把相机拉远,并在所有侧面填充细节
[制作正方形] 在两侧添加细节,把非正方形的图像变成正方形
[自定义缩放] (高级) 提供一个弹出文本框,允许你在缩小的同时改变提示,以及纵横比或精确缩放。要改变纵横比,设置--zoom 1,然后将--ar更改为目标值。此选项将尝试去除您之前图像上的黑色边框。


感谢阅读!如果你喜欢这次分享的内容,请把我的这封快讯分享给你的一个朋友。也欢迎你去我的YouTube频道 『 回到Axton 』看我的视频内容,咱们一起好奇地看世界!

保持健康,保持快乐!

Axton

Twitter | YouTube | Newsletter

Read more

AI 智能体工作流:用 Dify 打造本地、开源长文翻译神器

AI 智能体工作流:用 Dify 打造本地、开源长文翻译神器

今天我们来完成一个既有挑战性又有启发性的任务:我们来使用开源的 AI 开发平台 Dify 创建一个高质量的 AI 翻译助手。同时我们可以学习一种可以应用于不同平台的通用的方法。 虽然现在的 AI 翻译比传统的机器翻译提升了很多,但是依然不够令人满意。这就是为什么我们今天要学习一种新的方法来提升翻译的质量。这种方法就是 AI 界大神吴恩达老师最新开源的反思工作流。简单来说它就是一种让 AI 对自己的输出结果进行思考并进一步改进的方法。 反思工作流它的具体步骤实际上就是三步法:先让一个 AI 进行初始翻译打一个草稿,然后再让第二个 AI 去挑毛病,然后再让第三个 AI 对草稿进行最终的优化,形成最后的翻译结果。这就相当于是一个团队作业,三个臭皮匠胜过诸葛亮。这个过程不仅能够提高翻译的准确性,还可以让翻译更加符合目标语言的表达习惯。 在上期智图派,Coze 复刻吴恩达开源 AI 翻译神器 | 「智图派」 当中我使用 Coze 平台来实现过这个翻译的工作流,今天我们将使用另外一个 AI 开发平台 Dify 来再次实现这个工作流。我们可以通过这次实例来学习到如何把同一套思想同一套工作流在不

lock-1 By Axton
Coze 复刻吴恩达开源 AI 翻译神器 | 「智图派」

Coze 复刻吴恩达开源 AI 翻译神器 | 「智图派」

AI 最大的应用场景之一,就是翻译。虽然说现在的 AI 翻译比以前的机器翻译好了很多,但是常常还是不够完美。不过现在呢,有一种超强的方法可以显著提升 AI 翻译的水准,这就是 AI 界大神,吴恩达 Andrew Ng 教授最新开源的「反思工作流」 它利用prompt engineering,让AI不仅能翻译,还能"思考"如何改进翻译!这意味着,无论你要翻译的文档有多专业、多复杂,都能得到一个高度定制化的优质翻译。我们可以先看一下翻译效果。 吴恩达老师的反思翻译核心思路 吴恩达老师的翻译工作流可以归纳为两个核心要点: 第一,采用"初始翻译-反思-优化"的三步迭代流程,不断改进翻译质量。首先使用一个 AI 进行初始的翻译,然后让另一个 AI 对初始的翻译结果进行思考和评判,找出可以改进的地方,最后,由第三个

lock-1 By Axton
Jina Reader API 的四种用法 | 「智图派」

Jina Reader API 的四种用法 | 「智图派」

构建知识库,或者分析各种文章数据,是大家使用 AI 很重要的一个应用场景,因此我们常常会需要用到爬虫去爬取某个网站上的内容,现在,Jina 推出了一款非常简单好用的获取网页内容的工具,你只要把网址给它,它就能把网页内容整理成很适合大语言模型使用的格式,简直是构建知识库的利器。今天我就给大家介绍四种用法。分别包括在自动化工作流中使用以及在 AI 智能体中使用。 Jina Reader API 的网址是 读取器 API,你可以直接输入你需要爬取内容的网址 URL 在这边进行测试,输入之后直接点击按钮「获取内容」,就可以在右边得到结果了。 而他的用法也很简单,就是把你需要爬取内容的网页的 URL 写在 https://r.jina.ai 的后面就可以了。 什么是 Reader API Reader 是将任何URL转换为LLM友好的输入,只需简单添加前缀 https://r.jina.ai/ 无需付费即可获得改进后的适用于智能体或 RAG 系统的输出。

lock-1 By Axton
Coze 工作流获取 Tweets 详解 | 「智图派」

Coze 工作流获取 Tweets 详解 | 「智图派」

Coze是一个可以不用代码来搭建AI聊天机器人的平台。我在这期视频当中已经详细地讲解了Coze的各种功能,以及如何用到GPT-4 Turbo的模型。感兴趣的朋友可以回看一下。 自从 Twitter 被马斯克买了之后,如果你想从 Twitter 网站的外面来获取推文信息,也就是用 Twitter API,就需要每个月充值100美元了。但是 Coze 却很大方地让你可以免费地用部分 Twitter API 的功能了。今天我就先给大家演示一个可以批量获取多个 Twitter 作者的推文的工作流,把这个工作流嵌入到你的 AI 聊天机器人里面。比如我这里加了两个 Twitter 账号,我的和马斯克的,这样就可以一次性地获取到我们两个人的推文了。 今天我首先给大家演示一下在 Coze 上可以用到的 Twitter API 的功能,然后再演示一下批量获取推文的工作流,最后我们再聊一聊 Coze 的局限性。 Plugins 的基本功能 getUsers 首先第一个 "get users"

lock-1 By Axton