Seaborn load_dataset

     2023-02-16     25

关键词:

【中文标题】Seaborn load_dataset【英文标题】: 【发布时间】:2015-07-31 21:54:20 【问题描述】:

我正在尝试按照 example 使用 Seaborn 进行分组箱线图工作

我可以让上面的例子工作,但是行:

tips = sns.load_dataset("tips")

根本没有解释。我找到了tips.csv 文件,但似乎找不到关于load_dataset 具体功能的足够文档。我试图创建自己的 csv 并加载它,但无济于事。我还重命名了提示文件,它仍然有效......

我的问题是:

load_dataset 实际上在哪里寻找文件?我真的可以将它用于我自己的箱线图吗?

编辑:我设法使用自己的 DataFrame 制作了自己的箱线图,但我仍然想知道 load_dataset 是否用于神秘教程示例之外的任何其他内容。

【问题讨论】:

load_dataset 只是 seaborn 文档的一个便利功能。 【参考方案1】:

load_dataset 在https://github.com/mwaskom/seaborn-data 上查找在线 csv 文件。这是文档字符串:

从在线存储库加载数据集(需要互联网)。

参数


名称:str 数据集的名称(name.csv on https://github.com/mwaskom/seaborn-data)。您可以获取列表 可用数据集使用 :func:get_dataset_names

kws : 字典,可选 传递给 pandas.read_csv

如果您想修改该在线数据集或引入您自己的数据,您可能必须使用pandas。 load_dataset实际上返回了一个pandas DataFrame对象,你可以通过type(tips)确认。

如果您已经在名为tips2.csv 的csv 文件中创建了自己的数据,并将其保存在与脚本相同的位置,请使用此文件(在安装pandas 之后)将其加载:

import pandas as pd

tips2 = pd.read_csv('tips2.csv')

【讨论】:

奇怪的是load_dataset 文档实际上并没有说明它返回的内容。我知道这对那些使用过几次的人来说是显而易见的,但是一个人怎么能不记录这个基本事实呢? https://seaborn.pydata.org/generated/seaborn.load_dataset.html【参考方案2】:

只是为了添加到“selwyth”的答案中。

import pandas as pd
Data=pd.read_csv('Path\to\csv\')
Data.head(10)

成功完成这些步骤后。 现在绘图实际上是这样工作的。

假设您要绘制条形图。

sns.barplot(x=Data.Year,y=Data.Salary) //year and salary attributes were present in my dataset.

这实际上适用于 seaborn 中的每个绘图。

此外,我们将没有资格在 Seaborn Git 上添加我们自己的数据集。

【讨论】:

【参考方案3】:

从here 下载所有用于您的example 的csv 文件(压缩)。

将 zip 文件解压缩到本地目录并从同一目录启动您的 jupyter notebook。 在 jupyter notebook 中运行以下命令:

import pandas as pd
tips = pd.read_csv('seaborn-data-master/tips.csv')

您现在可以使用您的示例了!

【讨论】:

Seaborn violinplot 透明度

...透明的小提琴。我尝试了以下方法:importseabornassnstips=sns.load_dataset("tips")ax=sns.violinplot(x="day",y="total_bill", 查看详情

可视化库-seaborn-多变量分析绘图(第五天)(代码片段)

...r_codes=True)np.random.seed(sum(map(ord,‘distributions‘)))titantic=sns.load_dataset(‘titanic‘)tips=sns.load_dataset(‘tips‘)iris=sns.load_dataset(‘iris‘)#jitter=True把数据进行一个随机的偏移,使得数据分布清晰sns.stripplot(x=‘day‘,y=‘total_bill‘,data=tips,ji... 查看详情

seaborn笔记:绘制分类数据(代码片段)

0导入库importseabornassnsimportmatplotlib.pyplotaspltsns.set_theme(style="ticks",color_codes=True)1scatterplot        catplot()中数据的默认表示。    数据如下:tips=sns.load_dataset("tips 查看详情

如何在seaborn的条形顶部添加百分比

...放置百分比?importseabornassnssns.set(style="darkgrid")titanic=sns.load_dataset("titanic")ax=sns.countplot(x="c 查看详情

如何在seaborn的条形顶部添加百分比

...放置百分比?importseabornassnssns.set(style="darkgrid")titanic=sns.load_dataset("titanic")ax=sns.countplot(x="c 查看详情

seaborn笔记:绘制点的分布(代码片段)

1直方图1.0数据集importseabornassnspenguins=sns.load_dataset("penguins")penguins1.1 单变量直方图1.1.1 displotsns.displot(penguins,x="flipper_length_mm")1.1.2  histplotsns.histplot(penguins, 查看详情

在 seaborn 中的特定位置画一条线/注释 Facetgrid

...A在seaborn中使用Facetgrid制作了箱线图#Importthedatasettips=sns.load_dataset("tips")#PlotusingFacetGrid,se 查看详情

如何为 Seaborn Facet Plot 添加标题

...情节添加标题?让我们给它一个标题“IAMATITLE”。tips=sns.load_dataset("tips")g=sns.FacetGrid(tips,col="sex",row="smoker",margin_titl 查看详情

在 seaborn 散点图中对分类 x 轴进行排序

...如下所示。同一情节的可重现代码:importseabornassnsdf=sns.load_dataset(\'iris\')#functiontoreturntop30pe 查看详情

使用色调参数在seaborn中分割小提琴图

...定义为无)。使用与我所做的文档中类似的示例:tips=sns.load_dataset("tips")sns.violinplot(y="total_bi 查看详情

如何更改 seaborn pairplot 中仅 x 或 y 标签的字体大小?

...示例代码来制作seaborn的配对图:importseabornassnspenguins=sns.load_dataset("penguins")sns.pairplot(pengu 查看详情

seaborn笔记:可视化统计关系(散点图折线图)(代码片段)

 0 导入库importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimportseabornassnssns.set_theme(style="darkgrid")1散点图演示数据集tips=sns.load_dataset("tips")#导入一个数据集  1.0基础用法以下两种方式几 查看详情

如何用python给女朋友挑钻石(seaborn画图入门)(代码片段)

...值的figure,并且集成了多种在线数据集,通过sns.load_dataset()进行调用,可供学习,如果网络不稳定,可下载到本地,然后在调用的时候使用把cache 查看详情

可视化库-seaborn-回归分析绘图(第五天)(代码片段)

...color_codes=True)np.random.seed(sum(map(ord,‘distributions‘)))tips=sns.load_dataset(‘tips‘)print(tips.head())#regplot()和lmplot()画出拟合曲线sns.regplot(x=‘total_bill‘,y=‘tip‘,data=tips)plt.show()2.对于离散的变量来说,可以添加x_jitter产生随机的偏移sns.regp... 查看详情

seaborn的简述

...grid,whitegrid,dark,white,ticks;7、sns.load_dataset(“”)调用数据集8、sns.despine(offset=100)#offset表示图形到轴线的距离9、set_context()环境设置专用接口,设置后全局绘图环境随之改变,绘图环境有notebook&#x... 查看详情

可视化库-seaborn-facetgrid(第五天)(代码片段)

...color_codes=True)np.random.seed(sum(map(ord,‘distributions‘)))tips=sns.load_dataset(‘tips‘)#使用sns.Facetgrid画一个基本的直方图g=sns.FacetGrid(tips,col=‘time‘)g.map(plt.hist,‘tip‘)plt.show()2.添加sns.Facetgrid属性hue,画散点图g=sns.FacetGrid(tips,col=‘sex‘,hue=... 查看详情

matplotlib自带的几种美化样式(代码片段)

...fivethirtyeight‘,  ‘ggplot‘,‘grayscale‘,      ‘seaborn-bright‘,  ‘seaborn-colorblind‘,‘seaborn-dark-palette‘,‘seaborn-dark‘,   ‘seaborn-darkgrid‘,‘seaborn-deep‘,     ‘seaborn-muted‘,  ‘seaborn-notebook‘,‘seaborn-pape... 查看详情

删除 Seaborn 条形图图例标题

】删除Seaborn条形图图例标题【英文标题】:RemoveSeabornbarplotlegendtitle【发布时间】:2017-08-2608:39:12【问题描述】:我使用seaborn绘制分组条形图,如https://seaborn.pydata.org/examples/factorplot_bars.html给我:https://seaborn.pydata.org/_images/factorpl... 查看详情