郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib)_pandas.dataframe(data=scores,index=names,columns=c-CSDN博客

本文链接：https://blog.csdn.net/qq_51825761/article/details/136600000

多维数组库numpy

numpy创建数组的常用函数

# numpy数组

import numpy as np #以后numpy简写为np
print(np.array([1,2,3])) #>>[1 2 3]
print(np.arange(1,9,2)) #>>[1 3 5 7] 不包括9
print(np.linspace(1,10,4)) #>>[ 1. 4. 7. 10.]
# linespace(x,y,n)，创建一个由区间[x,y]的n-1等分点构成的一维数组，包含x和y

print(np.random.randint(10,20,[2,3]))
#>>[[12 19 12]
#>> [19 13 10]]

print(np.random.randint(10,20,5)) #>>[12 19 19 10 13]
a = np.zeros(3)
print(a) #>>[ 0. 0. 0.]
print(list(a)) #>>[0.0, 0.0, 0.0] 
# 列表每个元素之间有一个逗号隔开

a = np.zeros((2,3),dtype=int) #创建一个2行3列的元素都是整数0的数组
print(a)

numpy数组常用属性和函数

# numpy数组常用属性和函数

import numpy as np
b = np.array([i for i in range(12)])
#b是[ 0 1 2 3 4 5 6 7 8 9 10 11]
print(b)

a = b.reshape((3,4)) #转换成3行4列的数组，b不变
print(len(a)) #>>3 a有3行
print(a.size) #>>12 a的元素个数是12
print(a.ndim) #>>2 a是2维的
print(a.shape) #>>(3, 4) a是3行4列
print(a.dtype) #>>int32 a的元素类型是32位的整数
L = a.tolist() #转换成列表，a不变
print(L)
#>>[[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11]]
b = a.flatten() #转换成一维数组
print(b) #>>[ 0 1 2 3 4 5 6 7 8 9 10 11 ]

numpy数组元素的增删

# numpy添加数组元素

import numpy as np
a = np.array((1,2,3)) #a是[1 2 3]
b = np.append(a,10) #a不会发生变化
print(a)
print(b) #>>[ 1 2 3 10]
print(np.append(a,[10,20])) #>>[ 1 2 3 10 20]
c = np.zeros((2,3),dtype=int) #c是2行3列的全0数组
print(np.append(a,c)) #>>[1 2 3 0 0 0 0 0 0]
print(np.concatenate((a,[10,20],a)))
#>>[ 1 2 3 10 20 1 2 3]
print(np.concatenate((c,np.array([[10,20,30]]))))
#c拼接一行[10,20,30]得新数组
print(np.concatenate((c,np.array([[1,2],[10,20]])),axis=1))
#c的第0行拼接了1，2两个元素、第1行拼接了10,20两个新元素后得到新数素

# numpy删除数组元素

import numpy as np
a = np.array((1,2,3,4))
b = np.delete(a,1) #删除a中下标为1的元素,a不会改变
print(b) #>>[1 3 4]
b = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
print("b删除前：\n",b,"\nb删除后：")

print("按行删除:\n", np.delete(b,1,axis=0)) #删除b的第1行得新数组

print("按列删除:\n", np.delete(b,1,axis=1)) #删除b的第1行得新数组

#>>[[ 1 2 3 4]
#>> [ 9 10 11 12]]
print(np.delete(b,1,axis=1)) #删除b的第1列得新数组
print(np.delete(b,[1,2],axis=0)) #删除b的第1行和第2行得新数组
print(np.delete(b,[1,3],axis=1)) #删除b的第1列和第3列得新数组

在numpy数组中查找元素

np.argwhere( a ):返回非0的数组元组的索引，其中a是要索引数组的条件。
np.where(condition) 当where内只有一个参数时，那个参数表示条件，当条件成立时， where返回的是每个符合condition条件元素的坐标,返回的是以元组的形式。

# 在numpy数组中查找元素

import numpy as np
a = np.array((1,2,3,5,3,4))
print("a: ", a)

pos = np.argwhere(a==3) #pos是[[2] [4]]
print(pos)
# np.argwhere( a ):返回非0的数组元组的索引，其中a是要索引数组的条件。

a = np.array([[1,2,3],[4,5,2]])
print(2 in a) #>>True
pos = np.argwhere(a==2) #pos是[[0 1] [1 2]]
print(pos)

b = a[a>2] #抽取a中大于2的元素形成一个一维数组
print(b) #>>[3 4 5]
a[a > 2] = -1 #a变成[[ 1 2 -1] [-1 -1 2]]
print(a)

numpy数组的切片

numpy数组的切片是“视图”，是原数组的一部分，而非一部分的拷贝

# numpy数组的切片是“视图”，是原数组的一部分，而非一部分的拷贝

import numpy as np
a = np.arange(8) #a是[0 1 2 3 4 5 6 7]
b = a[3:6] #注意，b是a的一部分
print(b) #>>[3 4 5]
c = np.copy(a[3:6]) #c是a的一部分的拷贝
b[0] = 100 #会修改a
print(a) #>>[ 0 1 2 100 4 5 6 7]
print(c) #>>[3 4 5] c不受b影响
a = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16]])
print("a:\n", a)

b = a[1:3,1:4] #b是>>[[ 6 7 8] [10 11 12]]
print("b:\n", b)

数据分析库pandas

Pandas 属于 Python 第三方数据处理库，它基于 NumPy 构建而来，主要用于数据的处理与分析。我们知道对于机器学习而言数据是尤为重要，如果没有数据就无法训练模型。Pandas 提供了一个简单高效的 DataFrame 对象（类似于电子表格），它能够完成数据的清洗、预处理以及数据可视化工作等。除此之外，Pandas 能够非常轻松地实现对任何文件格式的读写操作，比如 CSV 文件、json 文件、excel 文件。(小伟学长：第三节基本人工智能工具的介绍与使用 · 语雀）