专栏名称: CDA数据分析师
CDA数据分析师品牌官方微信,开放、创新、分享。
目录
相关文章推荐
51好读  ›  专栏  ›  CDA数据分析师

Python之numpy数组学习(二)

CDA数据分析师  · 公众号  · 大数据  · 2017-05-23 19:17

正文

作者  Airy
本文转自AiryData,转载需授权


前言

前面我们学习了numpy库的简单应用,今天来学习下比较重要的如何处理数组。


处理数组形状

下面可将多维数组转换成一维数组时的情形。


利用以下函数处理数组的形状:

  • 拆解:ravel()函数可将多维数组变成一维数组。

  • 拉直(Flatten):flatten()函数与ravel()相同,但是,flatten()返回的是真实的数组,需要分配新的内存空间;而ravel()函数返回的只是数组的视图。

  • 用元组指定数组形状:除reshape()函数外,还可以用元组来定义数组的形状。

  • 转置:在线性代数中,矩阵的转置操作非常常见,转置是一种数据变换方法,对于二维表而言,转置就意味着行变成列,同时列变成行。

  • 调整大小:函数resize()的作用类似于reshape(),但是会改变所作用的数组。



堆叠数组

从深度看,数组既可以横向叠放,也可以竖向叠放。因此,可以使用vstack()、dstack()、hstack()、column_stack()、row_stack()、和concatenate()等函数。


首先我们要建立一些数组,然后整体说一下各种叠加方式,最后放上示例代码:


  • 水平叠加 :先介绍水平叠加方式,即用元组确定ndarrays()数组的形状,然后交由hstack()函数来码放这些数组。

  • 垂直叠加 :使用垂直叠加方法,先要构建一个元组,然后将元组交给vstack()函数来码放数组。

  • 深度叠加 还有一种深度叠加方法,这要用到dstack()函数和一个元组。这种方法是沿着第三个坐标轴(纵向)的方法来叠加一摞数组。举例来说:可以在一个图像数据的二维数组上叠加另一幅图像的数据。

  • 列式堆叠 :column_stack()函数以列方式对一维数组进行堆叠。

  • 行式堆叠 :同时,numpy也有以行方式对数组进行堆叠的函数,这个用于一维数组的函数名为row_stack(),它将数组作为行码放到二维数组中。


整体代码如下:


#-*- coding:utf-8 -*-
#stacking.py
import numpy as np

#创建数组
a = np.arange(9).reshape(3,3)

print(a)
#Out:
#array([[0, 1, 2],
#       [3, 4, 5],
#       [6, 7, 8]])

b = 2 * a

print (b)
#Out:
#array([[ 0,  2,  4],
#       [ 6,  8, 10],
#       [12, 14, 16]])

#水平叠加
print (np.hstack((a, b)))
#Out:
#array([[ 0,  1,  2,  0,  2,  4],
#       [ 3,  4,  5,  6,  8, 10],
#       [ 6,  7,  8, 12, 14, 16]])

print (np.concatenate((a, b), axis=1))
#Out:
#array([[ 0,  1,  2,  0,  2,  4],
#       [ 3,  4,  5,  6,  8, 10],
#       [ 6,  7,  8, 12, 14, 16]])
#垂直叠加
print (np.vstack((a, b)))
#Out:
#array([[ 0,  1,  2],
#       [ 3,  4,  5],
#       [ 6,  7,  8],
#       [ 0,  2,  4],
#       [ 6,  8, 10],
#       [12, 14, 16]])

print (np.concatenate((a, b), axis=0))
#Out:
#array([[ 0,  1,  2],
#       [ 3,  4,  5],
#       [ 6,  7,  8],
#       [ 0,  2,  4],
#       [ 6,  8, 10],
#       [12, 14, 16]])
#深度叠加
print (np.dstack((a, b)))
#Out:
#array([[[ 0,  0],
#        [ 1,  2],
#        [ 2,  4]],
#
#       [[ 3,  6],
#        [ 4,  8],
#        [ 5, 10]],
#
#       [[ 6, 12],
#        [ 7, 14],
#        [ 8, 16]]])

oned = np.arange(2)

print (oned)
#Out: array([0, 1])

twice_oned = 2 * oned

print (twice_oned)
#Out: array([0, 2])

print (np.column_stack((oned, twice_oned)))
#Out:
#array([[0, 0],
#       [1, 2]])

print (np.column_stack((a, b)))
#Out:
#array([[ 0,  1,  2,  0,  2,  4],
#       [ 3,  4,  5,  6,  8, 10],
#       [ 6,  7,  8, 12, 14, 16]])
#数组对比
print (np.column_stack((a, b)) == np.hstack((a, b)))
#Out:
#array([[ True,  True,  True,  True,  True,  True],
#       [ True,  True,  True,  True,  True,  True],
#       [ True,  True,  True,  True,  True,  True]], dtype=bool)
#列式堆叠
print (np.row_stack((oned, twice_oned)))
#Out:
#array([[0, 1],
#       [0, 2]])

print (np.row_stack((a, b)))
#Out:
#array([[ 0,  1,  2],
#       [ 3,  4,  5],
#       [ 6,  7,  8],
#       [ 0,  2,  4],
#       [ 6,  8, 10],
#       [12, 14, 16]])

print (np.row_stack((a,b)) == np.vstack((a, b)))
#Out:
#array([[ True,  True,  True],
#       [ True,  True,  True],
#       [ True,  True,  True],
#       [ True,  True,  True],
#       [ True,  True,  True],
#       [ True,  True,  True]], dtype=bool)







请到「今天看啥」查看全文