DataFrame(表数据)

DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。

file

file

DataFrame 构造方法如下:

pandas.DataFrame( data, index, columns, dtype, copy)

参数说明:

  • data:一组数据(ndarray、series, map, lists, dict 等类型)。
  • index:索引值,或者可以称为行标签。
  • columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
  • dtype:数据类型。
  • copy:拷贝数据,默认为 False。

Pandas DataFrame 是一个二维的数组结构,类似二维数组。

import pandas as pd

data = [['Google',10.0],['Baidu',12.0],['Wiki',13.0]]

df = pd.DataFrame(data,columns=['Site','Age'])

print(df)

输出结果如下:
file

以下实例使用 ndarrays 创建,ndarray 的长度必须相同, 如果传递了 index,则索引的长度应等于数组的长度。如果没有传递索引,则默认情况下,索引将是range(n),其中n是数组长度。

import pandas as pd

data = {'Site':['Google', 'Baidu', 'Wiki'], 'Age':[10, 12, 13]}

df = pd.DataFrame(data)

print (df)

输出结果如下:
file

从以上输出结果可以知道, DataFrame 数据类型一个表格,包含 rows(行) 和 columns(列):
file

还可以使用字典(key/value),其中字典的 key 为列名:

import pandas as pd

data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]

df = pd.DataFrame(data)

print (df)

输出结果为:
file
没有对应的部分数据为 NaN。

Pandas 可以使用 loc 属性返回指定行的数据,如果没有设置索引,第一行索引为 0,第二行索引为 1,以此类推:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

# 数据载入到 DataFrame 对象
df = pd.DataFrame(data)

# 返回第一行
print(df.loc[0])
# 返回第二行
print(df.loc[1])

输出结果为:
file
注意:返回结果其实就是一个 Pandas DataFrame 数据。

我们可以指定索引值,如下实例:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

print(df)

file

Pandas 可以使用 loc 属性返回指定索引对应到某一行:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

# 指定索引
print(df.loc["day2"])

输出结果为:
file

若文章对你有帮助,可以点赞或打赏支持我们。发布者:Aurora,转载请注明出处:http://61.174.243.28:13541/AY-knowledg-hub/dataframe%e8%a1%a8%e6%95%b0%e6%8d%ae/

(0)
AuroraAurora站点维系者
上一篇 2023年 5月 16日 下午3:42
下一篇 2023年 5月 16日 下午3:44

相关推荐

  • strace

    文章目录strace补充说明语法选项实例常用参数说明综合例子 strace 跟踪系统调用和信号 补充说明 strace命令 是一个集诊断、调试、统计与一体的工具,我们可以使用str…

    入门教程 2024年 3月 11日
  • bind

    文章目录bind补充说明语法选项实例 bind 显示或设置键盘按键与其相关的功能 补充说明 bind命令 用于显示和设置命令行的键盘序列绑定功能。通过这一命令,可以提高命令行中操作…

    入门教程 2023年 12月 6日
  • pstree

    文章目录pstree补充说明语法选项实例 pstree 以树状图的方式展现进程之间的派生关系 补充说明 pstree命令 以树状图的方式展现进程之间的派生关系,显示效果比较直观。 …

    入门教程 2024年 3月 1日
  • nohup

    文章目录nohup补充说明语法选项参数实例 nohup 将程序以忽略挂起信号的方式运行起来 补充说明 nohup命令 可以将程序以忽略挂起信号的方式运行起来,被运行的程序的输出信息…

    入门教程 2024年 1月 10日
  • pwunconv

    文章目录pwunconv补充说明语法实例 pwunconv 用来关闭用户的投影密码 补充说明 pwunconv命令 与pwconv功能相反,用来关闭用户的投影密码。它会把密码从sh…

    入门教程 2024年 3月 1日
  • usermod

    文章目录usermod补充说明语法选项参数实例 usermod 用于修改用户的基本信息 补充说明 usermod命令 用于修改用户的基本信息。usermod 命令不允许你改变正在线…

    入门教程 2024年 3月 11日
  • apt-sortpkgs

    文章目录apt-sortpkgs补充说明语法选项参数 apt-sortpkgs Debian Linux下对软件包索引文件进行排序的工具 补充说明 apt-sortpkgs命令 是…

    入门教程 2023年 12月 6日
  • telinit

    文章目录telinit补充说明语法选项参数EnvironmentFiles telinit 切换当前正在运行系统的运行等级 补充说明 telinit命令 用于切换当前正在运行的Li…

    入门教程 2024年 3月 11日
  • squid

    文章目录squid补充说明语法选项 squid squid服务器守护进程 补充说明 squid命令 高性能的Web客户端代理缓存服务器套件“squid”的服务器守护进程。 语法 s…

    入门教程 2024年 3月 5日
  • nslookup

    文章目录nslookup补充说明语法选项参数DNS服务器实例 nslookup 查询域名DNS信息的工具 补充说明 nslookup命令 是常用域名查询工具,就是查DNS信息用的命…

    入门教程 2024年 1月 10日

发表回复

登录后才能评论
Translate »