Home100个必会的python库
100个必会的python库

100个必会的python库

@程序员小寒

大家好,我是小寒,耗时三个月打造的100个必会的python库终于和大家见面了。

小册共有七个专栏:数据分析与处理、可视化和GUI、时间序列预测、自动化机器学习、机器学习可解释性、知识图谱、ChatGPT相关。

购买后加微信 dataalgo,添加后备注 【python库】,我会送你一份python全套视频资料,同时拉你进入陪伴群,大家可以互相交流学习。

原价199,现价10元永久买断,每涨500人,涨价10元。承诺更新 100 篇文章,15天更新完毕。
订阅63
文章76
最后更新:2024-4-9 14:12
查看 【100个必会的python库】 详情查看 【程序员小寒】 主页
分享到微信打开

免费内容

2024-1-11 0:32

PandasGUI,一个具有图形用户界面 pandas 库

Pandas 是进行数据处理和分析的流行的 python 库。虽然对于初学者或那些喜欢更直观的方法来快速学习它并不容易。但 PandasGUI 提供了一个令人难以置信的解决方案:一个具有图形用户界面的惊人库,可简化数据操作和可视化功能。https://github.com/adamerose/PandasGUI本文将逐步安装它并展示其可增强数据分析能力的卓越功能。开始使用 PandasGUI要开始使用 PandasGUI,第一步是安装它。可以直接通过 pip 命令来进行安装。pip install pandasgui接下来引入它。import pandas as pd import pandasgui最后一步是加载数据集以用于演示该库的功能。你可以加载你选择的结构化数据集,也可以使用 PandasGUI 可用数据集。在本文中,我们将使用 PandasGUI 库附带的泰坦尼克号数据集。from pandasgui.datasets import titanic现在,我们准备启动 PandasGUI。只需调用 show() 函数,如下面的代码所示:pandasgui.show(titanic)执行这些命令后,将打开一个新窗口以显示你上传的数据框。PandasGUI 功能 用户界面非常简单。它由以下组件组成。我将在后面的小节中介绍它们。查看和排序 DataFrame 重塑数据框 数据帧过滤 汇总统计 交互式绘图 查看和排序 DataFramePandasGUI 的第一个功能是按升序和降序查看和排序 DataFrame。这是数据探索的重要一步,可以轻松完成,如下图所示: 重塑数据框PandasGUI 提供了两种重塑数据框的方法,即 pivot 和 melts。pivot 通过将值从一列移动到多列来转换数据框。另一方面,melt 方法使你能够取消透视数据框,将多个列合并为一个列,同时将其他列保留为变量。在下面的 gif 中,我们将使用 pivot 方法重塑泰坦尼克号数据框:数据帧过滤在许多情况下,你希望根据特定条件过滤数据集以进一步了解数据或从数据集中提取特定切片。要首先使用 PandasGUI 对你的数据应用过滤器,你将转到过滤器部分并编写每个过滤器然后应用它。假设我们只想获得以下乘客:Sex == ‘male’Pclass == ‘3’Survived ==130 < Age < 40在下面的 gif 中是将这四个过滤器应用于泰坦尼克号数据集的分步指南:汇总统计你还可以使用 PandasGUI 为 DataFrame 提供详细的统计概览。这将包括数据集每一列的均值、标准差、最小值和最大值。交互式绘图最后,PandasGUI 为你的数据集提供了强大的交互式绘图选项,其中包括: 直方图散点图 线图 条形图 箱线图 小提琴绘图 3D散点图 热图饼图 词云 在下图中,我们将为我们的数据集创建三个交互:饼图、条形图和词云。本文重点介绍了 PandasGUI 的功能,这是一个强大的库,它向广泛使用的 Pandas 库添加了图形用户界面。我们首先演示了它的安装,加载了一个示例数据集,并探索了过滤、排序和统计分析等功能。

2024-1-11 0:20

PyGWalker,最好的数据分析库

PyGWalker 像一个神奇的工具,会使数据分析变得超级简单。它会获取你的数据并将其转换为你可以与之交互的特殊表格,就像使用 Tableau 一样。你可以直观地探索数据、使用它并查看模式和见解,而不会迷失在复杂的代码中。PyGWalker 简化了一切,因此你可以快速、轻松地分析和理解你的数据。https://github.com/Kanaries/pygwalker安装库我们可以通过 pip 来进行安装。pip install pygwalker要开始在 Jupyter Notebook 中使用 PyGWalker,你需要导入两个基本库:pandas 和 pygwalker。import pandas as pd import pygwalker as pyg导入后,你可以将 PyGWalker 无缝集成到现有工作流程中。例如,你可以使用 pandas 加载数据。df = pd.read_csv( 'my_data.csv' )然后,你可以通过将 DataFrame 作为参数传递来创建一个名为 “ gwalker ” 的 PyGWalker 实例。gwalker = pyg.walk(df)当你执行提供的命令时,新的输出将出现在代码单元格下方。此输出将包含一个交互式用户界面。该界面提供了各种拖放功能,你可以利用它们来分析和探索数据。它提供了一种便捷式的交互方式,使你能够执行可视化数据、探索关系等任务。借助 PyGWalker,你现在拥有类似于 Tableau 的用户界面,可以让你分析和可视化数据。PyGWalker 提供了更改图表类型的灵活性,使你能够创建不同的图表。例如,你可以通过选择所需的变量并选择折线图类型来轻松切换到折线图。你还可以通过创建连续视图来比较不同的度量。通过向行或列添加多个度量,你可以轻松地并排分析和比较它们。你可以根据特定类别或特征将数据组织成单独的部分。这有助于你单独分析和比较不同的数据子集。PyGWalker 允许你以表格格式查看数据并自定义分析类型和语义类型。你可以轻松地以结构化方式可视化数据,并根据你的特定需求调整数据的分析和解释方式。你还可以将数据探索结果保存到本地文件。PyGWalker 是一个多功能库,提供多种功能。探索这个强大的工具可以增强你在数据分析和可视化方面的技能。