DataFrame(表数据)

DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。

file

file

DataFrame 构造方法如下:

pandas.DataFrame( data, index, columns, dtype, copy)

参数说明:

  • data:一组数据(ndarray、series, map, lists, dict 等类型)。
  • index:索引值,或者可以称为行标签。
  • columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
  • dtype:数据类型。
  • copy:拷贝数据,默认为 False。

Pandas DataFrame 是一个二维的数组结构,类似二维数组。

import pandas as pd

data = [['Google',10.0],['Baidu',12.0],['Wiki',13.0]]

df = pd.DataFrame(data,columns=['Site','Age'])

print(df)

输出结果如下:
file

以下实例使用 ndarrays 创建,ndarray 的长度必须相同, 如果传递了 index,则索引的长度应等于数组的长度。如果没有传递索引,则默认情况下,索引将是range(n),其中n是数组长度。

import pandas as pd

data = {'Site':['Google', 'Baidu', 'Wiki'], 'Age':[10, 12, 13]}

df = pd.DataFrame(data)

print (df)

输出结果如下:
file

从以上输出结果可以知道, DataFrame 数据类型一个表格,包含 rows(行) 和 columns(列):
file

还可以使用字典(key/value),其中字典的 key 为列名:

import pandas as pd

data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]

df = pd.DataFrame(data)

print (df)

输出结果为:
file
没有对应的部分数据为 NaN。

Pandas 可以使用 loc 属性返回指定行的数据,如果没有设置索引,第一行索引为 0,第二行索引为 1,以此类推:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

# 数据载入到 DataFrame 对象
df = pd.DataFrame(data)

# 返回第一行
print(df.loc[0])
# 返回第二行
print(df.loc[1])

输出结果为:
file
注意:返回结果其实就是一个 Pandas DataFrame 数据。

我们可以指定索引值,如下实例:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

print(df)

file

Pandas 可以使用 loc 属性返回指定索引对应到某一行:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

# 指定索引
print(df.loc["day2"])

输出结果为:
file

若文章对你有帮助,可以点赞或打赏支持我们。发布者:Aurora,转载请注明出处:http://61.174.243.28:13541/AY-knowledg-hub/dataframe%e8%a1%a8%e6%95%b0%e6%8d%ae/

(0)
AuroraAurora站点维系者
上一篇 2023年 5月 16日 下午3:42
下一篇 2023年 5月 16日 下午3:44

相关推荐

  • mount

    文章目录mount补充说明语法选项实例1实例2实例3 mount 用于挂载Linux系统外的文件 补充说明 mount命令 Linux mount命令是经常会使用到的命令,它用于挂…

    入门教程 2024年 1月 3日
  • setfacl

    文章目录setfacl补充说明选项 setfacl 设置文件访问控制列表 补充说明 setfacl命令 是用来在命令行里设置ACL(访问控制列表)。在命令行里,一系列的命令跟随以一…

    入门教程 2024年 3月 4日
  • vgconvert

    文章目录vgconvert补充说明语法选项参数实例 vgconvert 转换卷组元数据格式 补充说明 vgconvert命令 用于转换指定LVM卷组的元数据格式,通常将“LVM1”…

    入门教程 2024年 3月 11日
  • renice

    文章目录renice补充说明语法选项参数实例 renice 修改正在运行的进程的调度优先级 补充说明 renice命令 可以修改正在运行的进程的调度优先级。预设是以程序识别码指定程…

    入门教程 2024年 3月 1日
  • killall

    文章目录killall补充说明语法选项参数实例 killall 使用进程的名称来杀死一组进程 补充说明 killall命令 使用进程的名称来杀死进程,使用此指令可以杀死一组同名进程…

    入门教程 2023年 12月 19日
  • lpq

    文章目录lpq补充说明语法选项 lpq 显示打印队列中的打印任务的状态信息 补充说明 lpq命令 用于显示打印队列中的打印任务的状态信息。 语法 lpq(选项) 选项 -E:强制使…

    入门教程 2023年 12月 19日
  • exportfs

    exportfs 管理NFS共享文件系统列表 补充说明 exportfs 命令用来管理当前NFS共享的文件系统列表。 参数: -a 打开或取消所有目录共享。 -o options,…

    入门教程 2023年 12月 14日
  • HTML 头部

    文章目录HTML “HTML “元素HTML <title> 元素实例HTML “ 元素实例HTML 元素实例HTML &#8220…

    2023年 4月 12日
  • setpci

    文章目录setpci补充说明语法选项参数实例 setpci 查询和配置PCI设备的使用工具 补充说明 setpci命令 是一个查询和配置PCI设备的使用工具。 语法 setpci(…

    入门教程 2024年 3月 4日
  • ftpcount

    ftpcount 显示目前已FTP登入的用户人数 补充说明 显示目前已ftp登入的用户人数。执行这项指令可得知目前用FTP登入系统的人数以及FTP登入人数的上限。 语法: ftpc…

    入门教程 2023年 12月 14日

发表回复

登录后才能评论
Translate »