横向拼接
import pandas as pd
import numpy as np
df1 = pd.DataFrame([['Tom','2001',98],
['Jack','2002',63],
['Lucy','2003',88],
['Nick','2004',100]],columns=['姓名','学号','成绩'])
df2 = pd.DataFrame([['Tom','2001','一班'],
['Jack','2002','二班'],
['Lucy','2003','二班'],
['Anny','2005','一班']],columns=['姓名','学号','班级'])
重要参数介绍
- how:用来控制连接方式,可选inner(内连接),left(左连接),right(右连接),outer(外连接),默认选项为内连接
- on:指定基于某个共同列或某些共同列进行连接,默认选项为基于所有共同列进行连接
- left_on:如果连接时左右表的列名不一致,就不用on,而是指明左表列和右表列
- right_on:如果连接时左右表的列名不一致,就不用on,而是指明左表列和右表列
- left_index:如果是基于左表的索引,设置为True
- right_index:如果是基于右表的索引,设置为True
left_on可以和right_index一起使用,left_index可以和right_on一起使用
pd.merge(df1,df2,how='inner',on='学号')