快来体验PandasAI数据分析,将Pandas和ChatGPT结合起来

Pandas是一个开源工具包,它为数据科学家和分析师提供了使用Python数据操作和分析能力。Pandas库在机器学习和深度学习的预处理阶段非常流行。但现在有了AI的加持,你可以用它做更多事情。

本文介绍一个新的数据科学库——Pandas AI。一个将生成型AI能力整合到Pandas中的Python库,使数据帧架具有对话性。

什么是Pandas AI?

让数据帧具有对话性是什么意思?

正如其名,你可以与数据集进行对话,并得到快速响应。作为一名数据科学家或分析师,不需要再对着数据集进行无休止地浏览行和列。不过,Pandas AI并没有取代Pandas,它只是赋予了Pandas更强的能力!

数据科学家和分析师在分析阶段花费了大量的时间来清理数据。现在,他们将能够把数据分析提高到一个新的水平。数据专业人员研究不同的方法和流程,他们可以用这些方法和流程来最大程度地减少数据准备的时间,而现在他们可以使用Pandas AI。

PandasAI是与Pandas一起使用的,它不是Pandas的替代品。你可以向PandasAI提出有关数据集的问题,它将以Pandas DataFrames的形式返回答案,而不需要自己粗略地浏览和解决这些问题。

在OpenAI API的帮助下,Pandas AI旨在实现与机器进行虚拟对话以输出你想要的结果的目标,而不是必须自己编程完成任务。机器会用他们的语言输出结果 —— 机器可解释的代码(DataFrame)。

如何使用Pandas AI?

使用pip安装Pandas AI

pip install pandasai

使用OpenAI导入PandasAI

为了使用新的Pandas AI库,你需要一个OpenAI密钥。一旦在笔记本上启动后,你需要导入以下内容:

import pandas as pdfrom pandasai import PandasAIfrom pandasai.llm.openai import OpenAIllm = OpenAI(api_token=your_API_key)

如果你没有独特的OpenAI API密钥,你可以在OpenAI平台上创建一个账户,并在这里创建一个API密钥。你将收到一个5美元的积分,可用于探索和试验API。

完成所有设置后,你就可以开始使用Pandas AI了。

在Dataframe上运行模型

首先,你需要将OpenAI模型运行到Pandas AI:

pandas_ai = PandasAI(openAImodel)

然后,你需要在dataframe上运行模型,该模型由两个参数组成,即你正在使用的dataframe和你想问的问题:

pandas_ai.run(df, prompt='the question you would like to ask?')

例如,你可能正在查看数据集,并对某一列值大于5的行感兴趣。你可以通过使用Pandas AI来执行此操作:

import pandas as pdfrom pandasai import PandasAI# 示例DataFramedf = pd.DataFrame({"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],"gdp": [19294482071552, 2891615567872, 2411255037952, 3435817336832, 1745433788416, 1181205135360, 1607402389504, 1490967855104, 4380756541440, 14631844184064],"happiness_index": [6.94, 7.16, 6.66, 7.07, 6.38, 6.4, 7.23, 7.22, 5.87, 5.12]})# 实例化一个LLMfrom pandasai.llm.openai import OpenAIllm = OpenAI()pandas_ai = PandasAI(llm)pandas_ai.run(df, prompt='Which are the 5 happiest countries?')

它将返回一个DataFrame输出:

6Canada7 Australia1United Kingdom3 Germany0 United StatesName: country, dtype: object

它还具有执行更复杂查询的能力,例如数学计算和数据可视化。

如下是一个数据可视化的示例:

pandas_ai.run(df,"Plot the histogram of countries showing for each the gpd, using different colors for each bar",)

数据可视化输出:

图片来源:PandasAI

Pandas AI推出并不久,团队仍在研究如何改进这个库。如果你想看看使用Pandas AI的演示,请观看下面这段视频:

总结

尽管Pandas AI并不能取代Pandas,但它是一个可以提升工作流程的便捷工具。虽然你可以向Pandas AI询问有关数据集的问题,但你仍然需要精通编程,以便在库出现错误时进行纠正。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
标签:
上一篇2025-08-21

相关推荐

  • 莱特帀手机钱包-莱特币手机钱包

    【莱特帀手机钱包】——您的虚拟货币安全助手随着数字货币的兴起,莱特帀作为一种备受关注的加密货币,越来越受到投资者的青睐,为了方便用户安全、便捷地管理莱特帀资

    2025-08-21 18:58:49
    2019
  • ttm数字货币币钱包-ttt数字货币

    TTM数字货币币钱包——您的虚拟货币钱包助手随着数字货币的普及,越来越多的人开始关注并投资数字货币,数字货币的安全存储问题成为了投资者们面临的一大挑战,为了解

    2025-08-21 18:58:49
    2013
  • 货币钱包转账违法吗

    虚拟货币钱包助手:揭秘钱包转账的合法性与风险尊敬的用户,您好!作为虚拟货币钱包助手,今天我们来探讨一下关于虚拟货币钱包转账的合法性与风险问题,什么是虚拟货币钱包

    2025-08-21 18:58:49
    2005
  • 欧意交易所app最新下载安装_欧意OK交易平台App下载教程

    大家好,今天来跟大家分享一下如何下载安装欧意交易所的官方App,也就是欧意OK交易平台App,这个App可以帮助用户在手机上轻松进行数字资产的交易和管理,下面是详细的下

    2025-08-21 18:58:49
    2004
  • 派币今天价值多少钱(派币今日价值报告)

    派币今天价值多少钱(派币今日价值报告)如果你是一名投资者,特别是加密货币投资者,那么你可能会对派币的表现感兴趣。究竟,在今天的市场上,你的派币价值是多少呢?让我们

    2025-08-21 18:58:49
    2003
  • usdt钱包官方下载(高级版本V6.4.24)_USDT钱包是什么?

    USDT钱包是一款基于区块链技术的数字货币钱包,主要应用于泰达币(USDT)的存储、转账和交易,泰达币作为一种稳定币,其价值与美元挂钩,1 USDT兑换1美元,因此在数字货币市场

    2025-08-21 18:58:49
    2003
  • 虚拟币前十名的各币价格

    在数字货币的世界里,各种虚拟币的价格波动总是牵动着投资者的心,下面,我将为您详细介绍当前市值排名前十的虚拟币及其价格情况,帮助您更好地了解这个市场,我们需要明确

    2025-08-21 18:58:49
    2003
  • 鱼池sc钱包-鱼池钱包模式

    【鱼池SC钱包】——您的虚拟货币守护神随着区块链技术的不断发展,虚拟货币已经成为越来越多人的投资选择,为了方便用户安全、便捷地管理自己的虚拟货币资产,各种虚拟

    2025-08-21 18:58:49
    2003