DataFrame(表数据)

DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。

file

file

DataFrame 构造方法如下:

pandas.DataFrame( data, index, columns, dtype, copy)

参数说明:

  • data:一组数据(ndarray、series, map, lists, dict 等类型)。
  • index:索引值,或者可以称为行标签。
  • columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
  • dtype:数据类型。
  • copy:拷贝数据,默认为 False。

Pandas DataFrame 是一个二维的数组结构,类似二维数组。

import pandas as pd

data = [['Google',10.0],['Baidu',12.0],['Wiki',13.0]]

df = pd.DataFrame(data,columns=['Site','Age'])

print(df)

输出结果如下:
file

以下实例使用 ndarrays 创建,ndarray 的长度必须相同, 如果传递了 index,则索引的长度应等于数组的长度。如果没有传递索引,则默认情况下,索引将是range(n),其中n是数组长度。

import pandas as pd

data = {'Site':['Google', 'Baidu', 'Wiki'], 'Age':[10, 12, 13]}

df = pd.DataFrame(data)

print (df)

输出结果如下:
file

从以上输出结果可以知道, DataFrame 数据类型一个表格,包含 rows(行) 和 columns(列):
file

还可以使用字典(key/value),其中字典的 key 为列名:

import pandas as pd

data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]

df = pd.DataFrame(data)

print (df)

输出结果为:
file
没有对应的部分数据为 NaN。

Pandas 可以使用 loc 属性返回指定行的数据,如果没有设置索引,第一行索引为 0,第二行索引为 1,以此类推:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

# 数据载入到 DataFrame 对象
df = pd.DataFrame(data)

# 返回第一行
print(df.loc[0])
# 返回第二行
print(df.loc[1])

输出结果为:
file
注意:返回结果其实就是一个 Pandas DataFrame 数据。

我们可以指定索引值,如下实例:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

print(df)

file

Pandas 可以使用 loc 属性返回指定索引对应到某一行:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

# 指定索引
print(df.loc["day2"])

输出结果为:
file

若文章对你有帮助,可以点赞或打赏支持我们。发布者:Aurora,转载请注明出处:http://61.174.243.28:13541/AY-knowledg-hub/dataframe%e8%a1%a8%e6%95%b0%e6%8d%ae/

(0)
AuroraAurora站点维系者
上一篇 2023年 5月 16日 下午3:42
下一篇 2023年 5月 16日 下午3:44

相关推荐

  • xrandr

    文章目录xrandr补充说明语法选项参数实例 xrandr X 窗口系统配置管理工具 补充说明 xrandr命令RandR(Rotate and Resize,旋转与缩放)是一个X…

    入门教程 2024年 3月 11日
  • git

    文章目录git补充说明语法选项例子配置修改项目中的个人信息配置自动换行常见使用场景创建SSH密钥多账号ssh配置免密码登录远程服务器https协议下提交代码免密码文件推向3个git…

    入门教程 2023年 12月 14日
  • gpasswd

    文章目录gpasswd补充说明语法选项参数实例 gpasswd Linux下工作组文件的管理工具 补充说明 gpasswd命令 是Linux下工作组文件/etc/group和/et…

    入门教程 2023年 12月 14日
  • Helm | Helm 历史

    文章目录helm history简介可选项从父命令继承的命令请参阅 helm history 检索发布历史 简介 打印给定版本的历史修订。 默认会返回最大的256个历史版本。设置&…

    入门教程 2023年 12月 14日
  • gzexe

    文章目录gzexe补充说明语法选项参数 gzexe 用来压缩可执行文件 补充说明 gzexe命令 用来压缩可执行文件,压缩后的文件仍然为可执行文件,在执行时进行自动解压缩。当您去执…

    入门教程 2023年 12月 14日
  • vdfuse

    文章目录vdfuse补充说明什么是VirtualBox语法选项实例 vdfuse VirtualBox软件挂载VDI分区文件工具 补充说明 vdfuse命令 是VirtualBox…

    入门教程 2024年 3月 11日
  • HTML 元素

    HTML 文档由 HTML 元素定义。 文章目录HTML 元素HTML 元素语法嵌套的 HTML 元素HTML 文档实例HTML 实例解析不要忘记结束标签HTML 空元素HTML …

    入门教程 2023年 4月 11日
  • unzip

    文章目录unzip补充说明语法选项参数实例 unzip 用于解压缩由zip命令压缩的压缩包 补充说明 unzip命令 用于解压缩由zip命令压缩的“.zip”压缩包。 语法 unz…

    入门教程 2024年 3月 11日
  • read

    文章目录read补充说明语法选项参数实例read命令示例 read 从键盘读取变量值 补充说明 read命令 从键盘读取变量的值,通常用在shell脚本中与用户进行交互的场合。该命…

    入门教程 2024年 3月 1日
  • gpm

    文章目录gpm补充说明语法选项 gpm 提供文字模式下的滑鼠事件处理 补充说明 gpm命令 是Linux的虚拟控制台下的鼠标服务器,用于在虚拟控制台下实现鼠标复制和粘贴文本的功能。…

    入门教程 2023年 12月 14日

发表回复

登录后才能评论
Translate »