生成数据表

<>1、首先导入pandas库,一般都会用到numpy库,所以我们先导入备用:

import numpy as np 
import pandas as pd

<>2、导入CSV或者xlsx文件:

data = pd.read_csv(‘name.csv’,header=1)  默认读取第一个sheet

data = pd.read_csv(‘name.csv’,sheet_name='sheetName') 根据sheet名获取sheet

data = pd.read_csv(‘name.csv’,sheet_name=None)
获取所有sheet,data.keys()获取所有sheet_name 列表。

3用pandas创建数据表:
df = pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006],
"date":pd.date_range('20130102', periods=6), "city":['Beijing ', 'SH', '
guangzhou ', 'Shenzhen', 'shanghai', 'BEIJING '], "age":[23,44,54,32,34,32],
"category":['100-A','100-B','110-A','110-C','210-A','130-F'],
"price":[1200,np.nan,2133,5433,np.nan,4432]}, columns
=['id','date','city','category','age','price'])
4:读取指定的单行,数据会存在列表里面
#1:读取指定行 df=pd.read_excel('lemon.xlsx')#这个会直接默认读取到这个Excel的第一个表单
data=df.ix[0].values#0表示第一行 这里读取数据并不包含表头,要注意哦!
print("读取指定行的数据:\n{0}".format(data)) 上边的ix已经被废弃,用下边的代替 df.loc[:, ['B', 'A'] 或者
df.iloc['a', 'b']
2:读取指定的多行,数据会存在嵌套的列表里面:
df=pd.read_excel('lemon.xlsx')
data=df.ix[[1,2]].values#读取指定多行的话,就要在ix[]里面嵌套列表指定行数
print("读取指定行的数据:\n{0}".format(data))
3:读取指定的行列:
df=pd.read_excel('lemon.xlsx') data=df.ix[1,2]#读取第一行第二列的值,这里不需要嵌套列表
print("读取指定行的数据:\n{0}".format(data))
4:读取指定的多行多列值:
df=pd.read_excel('lemon.xlsx')
data=df.ix[[1,2],['title','data']].values#读取第一行第二行的title以及data列的值,这里需要嵌套列表
print("读取指定行的数据:\n{0}".format(data))
5:获取所有行的指定列
df=pd.read_excel('lemon.xlsx')
data=df.ix[:,['title','data']].values#读所有行的title以及data列的值,这里需要嵌套列表
print("读取指定行的数据:\n{0}".format(data))
6:获取行号并打印输出
df=pd.read_excel('lemon.xlsx') print("输出行号列表",df.index.values) 输出结果是: 输出行号列表
[0 1 2 3]
7:获取列名并打印输出
df=pd.read_excel('lemon.xlsx') print("输出列标题",df.columns.values) 运行结果如下所示:
输出列标题 ['case_id' 'title' 'data']
8:获取指定行数的值:

 
df=pd.read_excel('lemon.xlsx')
print("输出值",df.sample(3).values)#这个方法类似于head()方法以及df.values方法 输出值 [[2 '输入错误的密码'
'{"mobilephone":"18688773467","pwd":"12345678"}'] [3 '正常充值'
'{"mobilephone":"18688773467","amount":"1000"}'] [1 '正常登录'
'{"mobilephone":"18688773467","pwd":"123456"}']]
 

9:获取指定列的值:
df=pd.read_excel('lemon.xlsx') print("输出值\n",df['data'].values)
 

技术
今日推荐
PPT
阅读数 128
下载桌面版
GitHub
百度网盘(提取码:draw)
Gitee
云服务器优惠
阿里云优惠券
腾讯云优惠券
华为云优惠券
站点信息
问题反馈
邮箱:ixiaoyang8@qq.com
QQ群:766591547
关注微信