来源:关于数据分析与可视化
今天我们来讲一下用Pandas模块对数据集进行分析的时候,一些经常会用到的配置,通过这些配置的帮助,我们可以更加有效地来分析和挖掘出有价值的数据 。
数据集的准备这次我们需要用到的数据集是广为人所知的泰坦尼克号的乘客数据,我们先导入并且读取数据集
import pandas as pd
展示更多的行【数据挖掘方法,数据挖掘的分析方法推荐?】Pandas默认只展示60行的数据,如果数据集当中的数量超过了60行,
df = pd.read_csv(\"train.csv\")
pd.get_option(\'display.max_rows\')
output
## 或者是
pd.options.display.max_rows
60
要是数据集当中的数据超过了60行,则会将中间的数据给折叠起来,展示出来前面的5行以及最后的5行,如下图所示
当然我们也可以改变最多展示出来的行数,代码如下
pd.set_option(\'display.max_rows\', 200)
或者我们要是想将所有的数据都给展示出来的话,就设置成None,当然要是我们的数据集很长很长的话,有几万行几十万行的话,这么做可能会使得notebook崩掉
pd.set_option(\'display.max_rows\', None)
展示更多的列同样地,pandas默认只展示20列的数据
或者是
# pd.options.display.max_rows = None
pd.get_option(\'display.max_columns\')
output
# pd.options.display.max_columns
20
要是数据集超过了20列的数据,中间的几列数据就会折叠起来,如下图所示
文章插图
当然我们也可以改变这个值,例如当数据集当中的数据超过了50列才会被折叠,代码如下
# 当数据集当中的数据超过了50列才会被折叠
pd.set_option(\'display.max_columns\', 50)
# pd.options.display.max_columns = 50
或者就干脆展示出来所有的列pd.set_option(\'display.max_columns\', None)
# pd.options.display.max_columns = None
改变列的宽度当我们想要展示数据集当中的前5列的时候df.head()
output文章插图
我们发现“Name”这一列当中的第二行因为字数比较多,就用了省略号来代替,这是因为Pandas对显示数据的量也是有限制的,
pd.get_option(\'display.max_colwidth\')
# pd.options.display.max_colwidth
当然我们也能改变这个默认值,代码如下pd.set_option(\'display.max_colwidth\', 500)
# pd.options.display.max_colwidth = 500
或者显示出所有的内容pd.set_option(\'display.max_colwidth\', None)
# pd.options.display.max_colwidth = None
改变浮点数的精度或许你也察觉到了Pandas对于浮点数的精度的展示也是有限制的,如下图所示文章插图
默认只展示小数点后面的6位小数,
pd.get_option(\'display.precision\')
# pd.options.display.precision
output6
要是我们只是希望展示小数点后面2位小数,则可以这么来做pd.set_option(\'display.precision\', 2)
# pd.options.display.precision = 2
我们来看一下最终的效果如何df.head()
output文章插图
个性化展示数字有时候我们遇到例如货币、百分比、小数等数字时,可以通过pandas当中的display.float_format方法来个性化展示数字,
- 成都疾控提醒以下人员自查报备是怎么回事,关于四川疾控发布紧急提示 这些人需报备的新消息。
- 头发该如何保养 最佳的洗头的时间是何时
- 1岁以下宝宝需要枕枕头吗 多大的宝宝才需要枕枕头
- 如何给宝宝冲奶粉 夏天宝宝喝奶的注意事项有哪些
- 全网营销怎么做,全网营销推广的技巧?
- 新疆是个好地方是怎么回事,关于新疆是个好地方二年级歌曲的新消息。
- 新疆昭苏又见天马浴河是怎么回事,关于昭苏县天马浴河的新消息。
- 元宵节舞龙吗
- 玉米是什么季节的产物
- 夜莺代表什么象征意义