Python Pandas读写CSV文件(附带实例)
Pandas 是基于 NumPy 构建的一个强大的 Python 数据分析库,提供了灵活且高效的数据结构,用于处理结构化数据。
Pandas 可以轻松地从多种文件格式中导入数据,如 CSV、Excel、JSON、SQL、HTML等,也可以将数据导出为这些格式。
例如:
pd.read_csv() 函数有许多可选参数,用以调整数据导入的方式,如文件分隔符、数据类型、日期解析等。例如:
to_csv() 方法也有许多可选参数,帮助调整导出的方式,如分隔符、是否包含列名等。例如:
以下是一个读写 CSV 文件的 Python 实例:
Pandas 可以轻松地从多种文件格式中导入数据,如 CSV、Excel、JSON、SQL、HTML等,也可以将数据导出为这些格式。
Pandas读取CSV文件
使用 pd.read_csv() 函数从 CSV 文件中读取数据,并将其转换为 DataFrame。例如:
import pandas as pd df = pd.read_csv('file.csv')其中,file.csv 是要导入的 CSV 文件的路径。如果 CSV 文件与 Python 脚本文件在同一目录下,则只需提供文件名即可;否则,需要提供完整的文件路径。
pd.read_csv() 函数有许多可选参数,用以调整数据导入的方式,如文件分隔符、数据类型、日期解析等。例如:
df = pd.read_csv('file.csv', sep=',', header=0, dtype={'column1':int, 'column2':float})
- sep 参数指定了 CSV 文件中的分隔符,默认为逗号(,);
- header参数指定了用作列名的行,默认为 0,表示使用第一行作为列名;
- dtype 参数指定了每列的数据类型,此处将 column1 指定为整数类型(int),将 column2 指定为浮点类型(float)。
Pandas写入CSV文件
使用 DataFrame 的 to_csv() 方法将 DataFrame 中的数据保存为 CSV 文件。例如:df.to_csv('output.csv', index=False)其中,output.csv 是要导出的文件名,index=False 表示不包含行索引。如果希望包含行索引,可以将 index 参数设置为 True。
to_csv() 方法也有许多可选参数,帮助调整导出的方式,如分隔符、是否包含列名等。例如:
df.to_csv('output.csv', sep='\t', index=False, header=True)其中,sep 参数指定了导出的 CSV 文件中的分隔符,默认为逗号;index 参数指定是否包含行索引,默认为 True;header 参数指定是否包含列名,默认为 True。
以下是一个读写 CSV 文件的 Python 实例:
import pandas as pd # 读取CSV文件 df = pd.read_csv('data.csv') # 显示数据 print(df.head()) # 修改数据 df.loc[0, 'Name'] = 'John Doe' df.loc[1, 'Age'] = 30 # 添加新列 df['City'] = ['New York', 'Los Angeles', 'Chicago'] # 保存修改后的数据到新的CSV文件 df.to_csv('updated_data.csv', index=False)
- 使用 pd.read_csv() 函数读取名为 data.csv 的 CSV 文件,并将其转换为 DataFrame 对象 df;
- 使用 df.head() 函数显示 DataFrame 的前几行数据;
- 使用 df.loc[] 方法修改 DataFrame 中特定行和列的值;
- 使用 df['City'] 添加一个新列 City,并为前三行分配城市名称;
- 使用 df.to_csv() 函数将修改后的 DataFrame 保存到新的 CSV 文件 updated_data.csv 中,不包含行索引。