亲宝软件园·资讯

展开

Python提取csv数据并筛选

PangAy 人气:0

前言

本文主要介绍通过Python提取csv文件中数据,并对数据进行处理。

编译器:Anaconda3 语言:Python3

一、使用pandas和numpy库

通过pandas库可以从csv提取到数据,但是数据的格式是DateFrame 格式,因为我不懂怎么处理DateFrame 格式的数据,所以就使用numpy库,将提取的数据转化为数组格式,这样可以就可以通过对数组的处理方式处理csv文件的数据。写回csv文件的过程中,再转换为DateFrame即可。

二、使用步骤

1.引入库

代码如下(示例):

import pandas as pd
import numpy as np

2.读入数据

本文是通过路径读取的文件。如果想通过文件名读取,需要把文件放与程序放到同一个文件夹中
代码如下(示例):

file1=pd.read_csv(r'C:\Users\86150\Desktop\1_Part2 附加测试题\Part2 附加测试题\4. data\data【各省-竞品】.csv')

此时读出的数据是DateFrame格式,输出如下

3.转化格式

将DateFrame 格式的数据转化为数组

file1=np.array(file1)

此时得到输出如下

4.处理数据

我们将所有省份是‘黑龙江’的数据挑选出来,并放入新的数组中

data=[]
for item in file1:
    sh= item[0] 
    if "黑龙江" ==sh:
       # print(item)
        data.append(item) 

这样就把数据挑选出来并存放在data中

总结

这是第一次写博客,有很多不足的地方,希望大家指出,比如:如何直接把cell插入而不是以图片的形式。本文只是作者学习笔记,因为对很多库函数不知道,迫不得已想出来的方法

加载全部内容

相关教程
猜你喜欢
用户评论