ChatGPT Code Interpreter 高级指南 - 重创数据分析市场,中文词云,PDF、Excel文件处理,歌曲分析、MTV制作,生成视频、二维码,绘制分形艺术

ChatGPT Code Interpreter 高级指南 - 重创数据分析市场,中文词云,PDF、Excel文件处理,歌曲分析、MTV制作,生成视频、二维码,绘制分形艺术
掌握核心 AI 技能,探索前沿科技 👇


本文YouTube视频,请点击:https://youtu.be/cP5F8R0Vmqk


这两天,我深度地使用了ChatGPT的代码解释器。我没有想到,它会在数据分析中,自己决定采用一个非常复杂的分析方法。

它会分析音乐的情感,画出各种分形艺术,分析文章,生成中文的词云,处理PDF文档。至于生成一个带背景图的二维码,生成一个带字幕的小视频,这类简单任务,那就更是不在话下了。那测试完之后,我脑袋里冒出来的首先的想法就是,如果这不是未来,那什么才是未来呢?

想测试Code Interpreter找不到数据集?

数据集最佳下载地址: Kaggle: Your Home for Data Science,这是世界上最大的数据科学社区,拥有强大的工具和资源,可帮助你实现数据科学的目标。

中文PDF分析及中文词云

首先,我们看一下它的中文词云,以及对PDF文档的处理。我们先给它上传一个中文的小说《被讨厌的勇气》,然后让它生成这个文件的词云。结果看起来像是一堆乱码,那我就给它上传一个中文的字体文件。虽然他说他觉得结果不理想,但实际上他已经生成了中文的词云。

但是,目前这个词云的问题,就是他有太多不该出现的词了。比如说各种连接词、语气词,包括“青年”和“哲人”,这两个人本来就是这本书的主角。好,我们让他把这些词删掉。好,我们看到它生成的这个词云,还是有很多不该出现的词。我们呢,给它上传一个中文的停用词的文件,也就是说,是一个包含着所有不需要的词汇的文件。

好,这下呢,它生成的结果,虽然还是有一些多余的词,什么是啊,好吧之类的,但是已经比刚才前两次没有停用词的时候给出的结果好很多了。那么我们看他能不能总结一下这本书的要点,根据词云做出的一些初步推测:“人生”、“活”、“自己”、“问题”,他暗示到这本书涉及到一些关于人生、活、自我认知和解决问题的主题等等。这些基本上是偏差不太远的,因为这本书就是阿德勒心理学的一本书。

好,到这里我们可以看到,他对中文PDF文档的处理是没有问题的。而且你只要给他中文的字体文件,他也能没有任何问题的生成中文的词云。同时,如果你生成词云不仅仅是为了好看,而是为了有用的话,那也就需要给他一定的停止词。停止词列表越全,那么他生成的词云最终的效果也会越好。好,看完了中文的PDF文档,我们接下来看一下英文的PDF文档怎么样。

英文PDF词云及PDF转图片

好,这次我就给他上传了一个英文的PDF文档,就是GPT-4的一个论文,然后让他建立英文文档的PDF文档的词云。这下他自己就知道他要去移除一些常见的英文停用词了。然后生成词云之后,他主动的对这个词云进行了解释。比如他说“GPT-4”这是文件的主要主题,可能是一种技术算法或者工具的名称。“Model”这可能表示文件在讨论一种或多种模型等等。整个的解释很准确的描述了论文当中的主要内容。

然后,因为我在这个GPT-4的论文之前,给他上传过一个英文的PDF,让他去生成词云。但是因为那个PDF文档主要都是些图形,所以他就没有办法去提取当中的所有的文字。我就要求他,你不用提取文字了,你把这个PDF文档给我转成图片,然后压缩成一个压缩包给我。他就很顺利的把这个PDF文档,每一页给转换成了一个文本文件,然后把所有的文件压缩成一个压缩包,打包让我进行下载。这就可以体现出ChatGPT的Code Interpreter,它对基本的PDF处理已经是没有问题的了。

生成带字幕的视频以及滑动动画

好,看完了PDF文档的处理,咱们接下来看一个轻松一点的。首先,生成一个带字幕的小视频。我们可以看这个小视频,我把它拿到中间来,一个缩放的小视频,然后下面它有它自己生成的字幕。还有这种,大家可能看到过的一些用code interpreter生成的视频,就是把一个图片循环的滑动。让code interpreter去做这种类似的视频很简单的,一个python的初学者都能很快的自己写代码来搞定。这个我们就不去详细的讲解它,我给大家简单说一下小视频的生成过程就可以了。

这个视频实际上是首先你用MidJourney,它的无穷的缩放的功能,做出一系列的图片。比如说我这边做了8个图片,然后就把这些图片直接丢给code interpreter。同时你给他简单说一下这些图片大概的内容是什么,然后就让他去根据这些图片去生成一个视频,然后让他根据你告诉他的内容来给他配上字幕。其中的结果就是这样,他生成了一个不断循环播放的,看起来还挺好玩。

好,还是同样,类似于这种图形和视频的处理很简单。那接下来我们来看一个也很简单,但是相对来说有一定的实用性的功能,也就是可以让他生成一个二维码,尤其是可以让他生成一个在图片背景的二维码,看起来稍微的炫酷一点。好,我们来看一下。

带图片背景的二维码生成

首先,我让他把我的博客网址axtonliu.com生成二维码,并且显示出来。他上来就说他没有办法访问互联网来生成二维码,然后他说我可以给你提供一个python代码,然后就把代码给我了。那明显就是因为我给他的提示说的没说清楚,让他误解我的提示了。他肯定是认为,我想把我的网站上的内容给生成二维码。所以我就给他澄清一下。

那这下就没有问题了,他首先就生成了一个非常标准的二维码,当然也没有什么美感。那为了让这个二维码好看点,我就给他上传一个图片,然后我就告诉他,我给你上传了一个图片,请你把这个图片作为二维码的背景。没问题,它就生成了一个带背景的二维码。那这样看起来就好看一些,只不过图片看起来不是很清楚。然后我就让他,你能不能把图片显示的更明显一些呢?但是你要依然要保证,这个二维码是能够被扫出来的。

好,接下来他就把这个二维码给更新了一下,然后说他把这个白色的二维码背景,把这个白色的二维码给它替换成了一个淡蓝色,来增加整个二维码的一个可见性,图片的可见性,看起来稍微好一些。好,还是一样,生成二维码,这个也是很简单的一个事情,这个没什么大不了的,很多工具都能干。

🔋

在 AI 时代,掌握如何让 AI 为你效劳,成为了一项必备技能。我为您呈现一门独特的课程,「AI自动化工具包」,专注于提升您的工作效率与创意表达,引领您体验前所未有的自动化工作流程!立即点击,开始你的AI之旅!

电影数据文件分析

在这个电影数据的分析过程中,最后他给出了一个让我非常惊讶的分析方法。我们先不着急,慢慢的看到最后。

首先,我们来简介一下电影的数据文件。这个文件内容有多少列多少条记录,每列的名称以及它的中文意思。结果显示这个数据集包含了4380条记录,一共有14列。每一列的名称和中文意思如下:电影标题、制作日期、电影类型、时长、导演名称、导演职业、导演的出生年份、电影的评分、人数赞同指数、制作预算和票房收入。

接下来,我们把列名改成中文。因为这个数据文件的列名都是英文,我们看起来方便一些,接着进行改成中文。同时,为了让他后续更好地去做各种分析图表,我将中文字体文件也一并传给他。从前面然后知道了,如果你不给他中文字体文件,因为他没有内置的中文字体,他给你的图形是没有办法去显示中文的。好,我提供了中文字体文件,然后让他把列名都更改为中文。同时,让他根据这些数据,去进行一下这个电影的票房分析,看看他能给我们给出什么样的分析结果。

他直接给我们给出了三种不同的图表分析,来分析电影的票房收入。这就包括全球票房收入的线图、电影评分的直方图,以及制作预算和全球票房收入的关系。这三个图形都非常漂亮。我继续让他用一个图形来展示Top10电影的评级、票房收入、导演以及它的电影类型。然后让他告诉我,你是根据什么条件来确定Top10的。

这里实际上就体现出了ChatGPT的Code Interpreter和直接用Python来写代码,然后去运行代码的一个区别。就是ChatGPT,他本身他是具有自主意识自主能力的。如果你没有给他一个很明确的指令,比如说我让他去分析Top10,我没有告诉他你一定要去按照票房收入,来给我分析Top10的话,他自己可以自己来决定他用什么方式来给你一个Top10的名单,而且还给出一些很合理的理由。这就是他比较强的地方。

我们看一下他给出了一个Top10列表,在图表当中。蓝色的柱状图表示了每部电影的全球票房收入,红色的点代表了每部电影的平均评分。他是怎么挑这Top10的呢?他实际上就是按照票房收入来挑的Top10,然后还给出了一个简单的总结,有很多都是动作片,然后卡梅隆的电影在这个电影当中占了三部。

那我就问他,导演对电影的评级和票房哪一项影响更大呢?ChatGPT根据相关性的计算,结果就是,导演他和平均电影评分,以及平均全球票房收入的相关性系数是0.207,说明这个相关性不强,也就是导演是谁,他对电影的评分和票房收入影响不显著。这有点出乎意料,我一直觉得导演应该对这些影响挺显著的,但是ChatGPT给出的结果不是这样。

那么我询问,根据这些数据你能够分析出对票房影响最重要的因素吗?他依然采用了相关性系数的计算方式,然后对所有的因素进行了总结计算。这些因素就是电影时长、平均评分人数、赞同指数、制作预算。最后给出的结果是,电影在国内的票房收入,跟全球票房收入的相关性最大。其次是电影的制作预算和电影的评分人数。这基本上说明,拍电影花的钱越多,它最后的票房收入也就越高,这还是有很强的正相关性的。

接着我问他,你能创建出10个图形来展示不同的数据吗?最后请你对每个图形给出一个简短的解释。实际上我在测试当中的这些问题,都应该属于是开放式的问题。我并没有要求他,你根据票房收入给我画一个折线图,这种应该是非常简单就能做到的事情。开放式的问题,实际上就是不但体现了code interpreter它编程的能力,还体现了ChatGPT本身的理解和推理能力。所以说Code Interpreter,虽然它本质上就是一个Python的解释器,然后ChatGPT它会编码,但是结合起来你这么一想,这就相当于一个很厉害的AI,也就是ChatGPT它手上有了一个非常趁手的工具,这就比较厉害了。

也许Code Interpreter它不能完全的取代数据分析师,但是它会极大的抬高进入数据分析师的门槛。

他给出了10个漂亮的图形,然后这些图形是,都是什么图形呢?全球票房收入的线图、电影评分的直方图、制作预算和全球票房收入的关系、电影评分与全球票房收入的关系等等等等。图形很漂亮,中文列名没有显示出来,那这可能是他忘记了我曾经给过他一个中文字体文件了,提醒他一下就好。提醒他之后重新又绘制了一把,但是X轴和Y轴的中文没有出来,这个我们暂时先不管它了,因为这个不是什么大的问题,它能够显示中文这个已经是验证过的,所以然后先放过这个问题。

接下来,我再给他一个最开放的一个问题了,你能根据这些数据做出一个你认为最复杂和最有趣的分析吗?请用图表来表示,并且给出简短的解释。这一步我确实完全没有想到,他居然做了一个聚类分析。他用K-Means的一个聚类算法,把电影给分成了三类,根据电影的多个特性来分成了三类。聚类算法它本身就是机器学习当中一个非常常用的一个算法,但是让code interpreter去画一些折线图、直方图、甚至是散点图、热力图等等,这些可能都是一些低级水平的一些工作,也就相当于是一个低级别的数据分析员。但是到聚类分析这个层次,他就可以算得上是一个中级的数据分析员了。而且关键是,这不是我要求他这么干的,是他自己去想到要做这么一个分析的。

结果是,X轴和Y轴还是没有办法显示中文。我将这个问题提给了他,就说你的X轴和Y轴无法显示中文啊。只要你告诉他他的问题在哪,他很快就自己进行了一个修正,修正后的结果就显示的非常正常了。所以说,Code Interpreter做数据分析,确实还是一把好手。接着我们接下来看一下,它能不能处理Excel文件呢?同样我提供了提供一个Excel的数据文件,因为这些文件都是大家比较常用的,因为我也不知道他能不能处理Excel文件,我就先问他,你能处理Excel文件吗?他表示可以,然后我上传了一个Excel文件。

Excel文件分析

这个文件是薪水的一个数据文件,数据集。那我们就不用演示太多的功能了,我们就让他直接根据这个数据文件,来生成一个最有意义的图形,并且进行简短解释。那他生成的结果是什么呢?就是员工的工资和工作经验之间的关系,并且的颜色显示了教育程度的差异。X轴表示工作经验的年数,Y轴表示工资,每个点代表一个员工,颜色表示他的教育程度。最后的结果呢,基本上跟我们大家的认知是一样的,工资随着工作经验的增长而增长,不同教育程度之间的工资差距相当明显,尤其是在高工作经验年数的员工当中,拥有更高教育程度的员工,往往有更高的工资。基本上从数据分析当中,我们就可以看到code interpreter对常用的数据文件CSV、Excel,做一些我们日常所需要的一些数据分析,应该是不在话下了。这会极大的提高大部分人的工作效率。

奥德布洛特集合绘制

看完了枯燥的数据分析之后,我们再来看一点轻松的,调剂一下心情。我们让他去绘制一些漂亮的图形。首先我们问他,你能不能绘制一个奥德布罗特集合,然后并且以合适的格式展现出来呢?你可以选择图片、GIF或者MP4的视频。他表示他可以画一个静态图片,但是GIF和MP4可能没有办法去展示。所以呢,如果你需要GIF或者MP4的视频,他可以生成文件然后让我下载。

他首先生成了一个静态图片,这个图片你看起来没什么大不了的,而且可以说得上很难看。那是因为它的分辨率和迭代次数很低。那我就让它给我一个更高分辨率和更多迭代次数的MP4文件吧。第一次尝试呢,它失败了,因为这个时间太长,肯定是计算量太大,所以它要降低分辨率和迭代次数,然后在允许的时间范围内完成。这下就给我生成了一个简单的奥德布洛特集合的图形。

0:00
/0:00

分形艺术 - Julia集

那接下来呢,我也不指定让他生成什么图形了,让他自己来决定,生成一个分形艺术吧。那我就让他,你能自己创造出一个具有同样美感的艺术吗?他说当然可以,我给你创建一个Julia集的分形。直接创建出了一个Julia集的分形效果,看起来是不是也很不错呀?

歌曲频谱以及感情分析

首先我给他上传一个歌曲的mp3文件,让他进行分析。为了防止他从歌曲的文件名获得歌曲的信息,我们就把这个文件名改成一个毫无意义的文件名,比如说就给他改成“我不告诉你”。OK,不要逗他了,我们就改成1就OK了,1.mp3。

上传文件,我告诉他这是一首歌曲的MP3文件,请你绘制出频谱图,然后你尽可能的去理解这首歌曲,告诉我这首歌曲的感情,它是关于什么的,以及你觉得它好听吗?首先他说他可以创建频谱图,但是作为人工智能,他不能干这个不能干那个。

OK,我们先看看他的频谱图,频谱图没有问题,然后他继续表示他在分析情感方面能力比较弱,然后呢,好不好听,他作为一个人工智能呢,他也没办法评价。那这时候呢,我们就稍微鼓励他一下吧,然后让他,你不用管我怎么想,你做出你自己的一个评估就OK。好,我就告诉他,根据你所具有的能力,对歌曲进行你所能做到的分析,包括根据音乐特性所能推断出的情感,以及作为一个人工智能的角度,对歌曲的好听与否,做出自己的评估,不用考虑准确性。

他就对歌曲从节拍、它的频谱对比度以及什么频谱滞星,这些方面还有频谱的降落、零交叉率等等,我都没有听说过的一些术语进行了分析。基于这些特性,他推断出这首歌有一种中等的节奏和较大的能量水平,可能是一种积极或者快乐的情绪。当然他说这只是一种推测了。至于好不好听,他认为这首歌没有特别突出,没有特别好,也没有特别差,一般般。然后还不忘给自己留条后路,说他的评估只是基于统计分析,然后每个人有每个人的爱好。那这首歌到底是什么样的,到底好不好听呢,我们大家最后听一听MTV。

MTV生成,根据音乐+自己生成图片

到底好不好听呢,我们大家可以来一起来听一听。

0:00
/0:21

如果code interpreter的运行环境没有受到诸多的限制,那么我相信code interpreter它可以生成更加酷炫的效果。虽然ChatGPT的code interpreter它不会像有些人说的那么夸张,一下子可以抹去几百亿的数据分析的市场,但是就像我之前说的,code interpreter的出现,它极大的提高了数据分析师的门槛。所以未来你只需要掌握一种技能,那就是驾驭AI的能力。如果你想从现在开始,就请加入到我的AI和自动化课程当中,链接在描述


扫码进入Axton的AI精英学院

感谢阅读!如果你喜欢(不想看)这次分享的内容,请点个👍(或者点个👎)让我知道,同时请分享给你的一个朋友(前朋友)。也欢迎你去我的YouTube频道 『 回到Axton 』看我的视频内容,咱们一起好奇地看世界!

保持健康,保持快乐!

Axton

Twitter | YouTube | Newsletter | AI精英学院

Read more

AI 智能体工作流:用 Dify 打造本地、开源长文翻译神器

AI 智能体工作流:用 Dify 打造本地、开源长文翻译神器

今天我们来完成一个既有挑战性又有启发性的任务:我们来使用开源的 AI 开发平台 Dify 创建一个高质量的 AI 翻译助手。同时我们可以学习一种可以应用于不同平台的通用的方法。 虽然现在的 AI 翻译比传统的机器翻译提升了很多,但是依然不够令人满意。这就是为什么我们今天要学习一种新的方法来提升翻译的质量。这种方法就是 AI 界大神吴恩达老师最新开源的反思工作流。简单来说它就是一种让 AI 对自己的输出结果进行思考并进一步改进的方法。 反思工作流它的具体步骤实际上就是三步法:先让一个 AI 进行初始翻译打一个草稿,然后再让第二个 AI 去挑毛病,然后再让第三个 AI 对草稿进行最终的优化,形成最后的翻译结果。这就相当于是一个团队作业,三个臭皮匠胜过诸葛亮。这个过程不仅能够提高翻译的准确性,还可以让翻译更加符合目标语言的表达习惯。 在上期智图派,Coze 复刻吴恩达开源 AI 翻译神器 | 「智图派」 当中我使用 Coze 平台来实现过这个翻译的工作流,今天我们将使用另外一个 AI 开发平台 Dify 来再次实现这个工作流。我们可以通过这次实例来学习到如何把同一套思想同一套工作流在不

lock-1 By Axton
Coze 复刻吴恩达开源 AI 翻译神器 | 「智图派」

Coze 复刻吴恩达开源 AI 翻译神器 | 「智图派」

AI 最大的应用场景之一,就是翻译。虽然说现在的 AI 翻译比以前的机器翻译好了很多,但是常常还是不够完美。不过现在呢,有一种超强的方法可以显著提升 AI 翻译的水准,这就是 AI 界大神,吴恩达 Andrew Ng 教授最新开源的「反思工作流」 它利用prompt engineering,让AI不仅能翻译,还能"思考"如何改进翻译!这意味着,无论你要翻译的文档有多专业、多复杂,都能得到一个高度定制化的优质翻译。我们可以先看一下翻译效果。 吴恩达老师的反思翻译核心思路 吴恩达老师的翻译工作流可以归纳为两个核心要点: 第一,采用"初始翻译-反思-优化"的三步迭代流程,不断改进翻译质量。首先使用一个 AI 进行初始的翻译,然后让另一个 AI 对初始的翻译结果进行思考和评判,找出可以改进的地方,最后,由第三个

lock-1 By Axton
Jina Reader API 的四种用法 | 「智图派」

Jina Reader API 的四种用法 | 「智图派」

构建知识库,或者分析各种文章数据,是大家使用 AI 很重要的一个应用场景,因此我们常常会需要用到爬虫去爬取某个网站上的内容,现在,Jina 推出了一款非常简单好用的获取网页内容的工具,你只要把网址给它,它就能把网页内容整理成很适合大语言模型使用的格式,简直是构建知识库的利器。今天我就给大家介绍四种用法。分别包括在自动化工作流中使用以及在 AI 智能体中使用。 Jina Reader API 的网址是 读取器 API,你可以直接输入你需要爬取内容的网址 URL 在这边进行测试,输入之后直接点击按钮「获取内容」,就可以在右边得到结果了。 而他的用法也很简单,就是把你需要爬取内容的网页的 URL 写在 https://r.jina.ai 的后面就可以了。 什么是 Reader API Reader 是将任何URL转换为LLM友好的输入,只需简单添加前缀 https://r.jina.ai/ 无需付费即可获得改进后的适用于智能体或 RAG 系统的输出。

lock-1 By Axton
Coze 工作流获取 Tweets 详解 | 「智图派」

Coze 工作流获取 Tweets 详解 | 「智图派」

Coze是一个可以不用代码来搭建AI聊天机器人的平台。我在这期视频当中已经详细地讲解了Coze的各种功能,以及如何用到GPT-4 Turbo的模型。感兴趣的朋友可以回看一下。 自从 Twitter 被马斯克买了之后,如果你想从 Twitter 网站的外面来获取推文信息,也就是用 Twitter API,就需要每个月充值100美元了。但是 Coze 却很大方地让你可以免费地用部分 Twitter API 的功能了。今天我就先给大家演示一个可以批量获取多个 Twitter 作者的推文的工作流,把这个工作流嵌入到你的 AI 聊天机器人里面。比如我这里加了两个 Twitter 账号,我的和马斯克的,这样就可以一次性地获取到我们两个人的推文了。 今天我首先给大家演示一下在 Coze 上可以用到的 Twitter API 的功能,然后再演示一下批量获取推文的工作流,最后我们再聊一聊 Coze 的局限性。 Plugins 的基本功能 getUsers 首先第一个 "get users"

lock-1 By Axton