Python Pandas读写CSV文件（附带实例）

Pandas 是基于 NumPy 构建的一个强大的 Python 数据分析库，提供了灵活且高效的数据结构，用于处理结构化数据。

Pandas 可以轻松地从多种文件格式中导入数据，如 CSV、Excel、JSON、SQL、HTML等，也可以将数据导出为这些格式。

Pandas读取CSV文件

使用 pd.read_csv() 函数从 CSV 文件中读取数据，并将其转换为 DataFrame。

例如：

import pandas as pd
df = pd.read_csv('file.csv')

其中，file.csv 是要导入的 CSV 文件的路径。如果 CSV 文件与 Python 脚本文件在同一目录下，则只需提供文件名即可；否则，需要提供完整的文件路径。

pd.read_csv() 函数有许多可选参数，用以调整数据导入的方式，如文件分隔符、数据类型、日期解析等。例如：

df = pd.read_csv('file.csv', sep=',', header=0, dtype={'column1':int, 'column2':float})

sep 参数指定了 CSV 文件中的分隔符，默认为逗号（,）；
header参数指定了用作列名的行，默认为 0，表示使用第一行作为列名；
dtype 参数指定了每列的数据类型，此处将 column1 指定为整数类型（int），将 column2 指定为浮点类型（float）。

Pandas写入CSV文件

使用 DataFrame 的 to_csv() 方法将 DataFrame 中的数据保存为 CSV 文件。例如：

df.to_csv('output.csv', index=False)

其中，output.csv 是要导出的文件名，index=False 表示不包含行索引。如果希望包含行索引，可以将 index 参数设置为 True。

to_csv() 方法也有许多可选参数，帮助调整导出的方式，如分隔符、是否包含列名等。例如：

df.to_csv('output.csv', sep='\t', index=False, header=True)

其中，sep 参数指定了导出的 CSV 文件中的分隔符，默认为逗号；index 参数指定是否包含行索引，默认为 True；header 参数指定是否包含列名，默认为 True。

以下是一个读写 CSV 文件的 Python 实例：

import pandas as pd

# 读取CSV文件
df = pd.read_csv('data.csv')

# 显示数据
print(df.head())

# 修改数据
df.loc[0, 'Name'] = 'John Doe'
df.loc[1, 'Age'] = 30

# 添加新列
df['City'] = ['New York', 'Los Angeles', 'Chicago']

# 保存修改后的数据到新的CSV文件
df.to_csv('updated_data.csv', index=False)

使用 pd.read_csv() 函数读取名为 data.csv 的 CSV 文件，并将其转换为 DataFrame 对象 df；
使用 df.head() 函数显示 DataFrame 的前几行数据；
使用 df.loc[] 方法修改 DataFrame 中特定行和列的值；
使用 df['City'] 添加一个新列 City，并为前三行分配城市名称；
使用 df.to_csv() 函数将修改后的 DataFrame 保存到新的 CSV 文件 updated_data.csv 中，不包含行索引。

Python Pandas读写CSV文件（附带实例）

Pandas读取CSV文件

Pandas写入CSV文件

相关文章