3.1. Khởi tạo một mảng trên numpy¶

3.1.1. Khởi tạo ngay từ đầu¶

Để khởi tạo một mảng trên numpy chúng ta sử dụng câu lệnh rất quen thuộc là np.array(). Numpy cho phép chúng ta khởi tạo mảng được cấu hình theo định dạng dữ liệu cụ thể như float, interger, boolean, string. Chúng ta cũng lưu ý rằng các phần tử của một mảng trong numpy phải đồng nhất về định dạng dữ liệu.

import numpy as np

A = np.array([[1, 2],
              [3, 4]])

print(A)
print("dtype of matrix A: ", A.dtype)

[[1 2]
 [3 4]]
dtype of matrix A:  int64

Ban đầu các phần tử của ma trận \(\mathbf{A}\) gồm toàn những giá trị nguyên. Chúng ta có thể xác định định dạng dữ liệu cho ma trận ngay tại lúc khởi tạo thông qua đối số dtype.

B = np.array([[1, 2],
              [3, 4]], dtype=np.float32)

print(B)
print("dtype of matrix B: ", B.dtype)

[[1. 2.]
 [3. 4.]]
dtype of matrix B:  float32

Những mảng kiểu float thì giá trị các phần tử có thêm dấu . ở cuối để phân biệt với mảng số nguyên.

Ngoài cách thay đổi trên, định dạng của ma trận cũng có thể được biến đổi thông qua hàm A.astype(). Đây là một hàm thuộc tính có sẵn ở mỗi mảng.

# Lưu ý phải gán A = A.astype() để lưu thay đổi cho A
A = A.astype(np.float32)
print(A.dtype)

float32

3.1.2. Khởi tạo ngẫu nhiên¶

Nếu khởi tạo một ma trận nhỏ khoảng vài phần tử thì việc gõ tay là khả thi. Nhưng đối với những mảng kích thước lớn chúng ta sẽ không thể nhập hết toàn bộ các giá trị. Khi đó ta sẽ khởi tạo ngẫu nhiên cho những biến này.

np.random.randn(d0, d1, d2,..., dn): \(d_i\) là chiều thứ \(i\) của mảng. Theo cách này các giá trị sẽ được lấy mẫu ngẫu nhiên từ phân phối chuẩn hoá (normal distribution) có trung bình bằng 0 và phương sai bằng 1.

R = np.random.randn(2, 3)
print(R)

[[-0.84705218 -0.44591015 -0.68057193]
 [ 1.96496359  1.90712193 -0.41465353]]

np.random.normal(loc=0.0, scale=1.0, size=None): Khởi tạo mảng mà các phần tử của mảng tuân theo phân phối chuẩn (Gaussian distribution) với trung bình chính là loc và phương sai là scale. Phân phối Gaussian (hay còn gọi là phân phối chuẩn) là trường hợp tổng quát của phân phối chuẩn hoá, chúng có hàm mật độ xác suất pdf (probability density function) được tính dựa trên hai tham số trung bình và phương sai như sau:

\[pdf(x; \mu, \sigma) = \frac{\exp(\frac{-(x-\mu)^2}{2\sigma^2})}{\sqrt{2\pi \sigma^2}}\]

Chúng ta sẽ gặp lại phân phối này ở chương lý thuyết xác suất.

R = np.random.normal(loc=1, scale=2, size=(2, 3))
print(R)

[[ 4.35532037  1.23970291  1.54447465]
 [ 2.38912377  2.01603469 -1.46485996]]

np.random.uniform(low=0.0, high=1.0, size=None): Các phần sẽ được khởi tạo theo phân phối đều trong khoảng từ low tới high. Trong phân phối đều thì mật độ xác suất tại mọi điểm là như nhau giữa [low, high]:

\[pdf(x; low, high) = \frac{1}{high-low}\]

R = np.random.uniform(low=-1, high=1, size=(2, 3))
print(R)

[[-0.67195259 -0.11710832  0.40114137]
 [-0.40054265 -0.72930944 -0.75715529]]

Trong trường hợp bạn chỉ muốn sinh ngẫu nhiên đối với số nguyên thì có thể sử dụng hàm np.randint()

R = np.random.randint(low=-5, high=5, size=(2, 3))
print(R)

[[ 3  3 -3]
 [-1  0 -1]]

Ngoài ra còn các khởi tạo ngẫu nhiên theo phân phối khác như t-student, gamma, beta, chi-square, Fisher, ..... Bạn đọc có thể sử dụng như list các hàm mình liệt kê bên dưới:

np.random.standard_t(df, size=None): Phân phối t-student.
np.random.chisquare(df, size=None): Phân phối Chi-square.
np.random.f(dfnum, dfden, size=None): Phân phối Fisher.
np.random.gamma(shape, scale=1.0, size=None): Phân phối gamma
np.random.beta(a, b, size=None): Phân phối beta

	0	1	2
0	-1.742997	-0.052210	0.999264
1	-0.679525	-0.213946	0.094395
2	-2.193314	1.087446	1.161185

Deep AI KhanhBlog

3.1. Khởi tạo một mảng trên numpy¶

3.1.1. Khởi tạo ngay từ đầu¶

3.1.2. Khởi tạo ngẫu nhiên¶

3.2. Đọc và save numpy từ file¶

3.2.1. Save numpy¶

3.2.2. Load numpy từ file¶

3.2.3. convert mảng từ dataframe¶

3.2. Truy cập mảng trên numpy¶

3.3. Thay đổi shape của mảng¶

3.3.1. Reshape mảng¶

3.3.2. Chuyển vị các chiều¶

3.3.3. Concatenate và Stack hai mảng¶

3.3.4. Mở rộng mảng¶

3.4. Các hàm trên numpy¶

3.4.1. min, max, mean, sum¶

3.4.2. minimum, maximum¶

3.4.3. argmax, argmin¶

3.4.4. argsort¶

3.4.5. np.exp() và hàm softmax¶

3.4.6. Giữ nguyên shape¶

3.4.7. Gieo hạt và trộn lẫn dữ liệu trên numpy¶

3.5. Các ma trận đặc biệt¶

3.5.1. Ma trận đơn vị¶

3.5.2. Ma trận 1¶

3.5.3. Ma trận 0¶

3.5.4. Ma trận đường chéo chính¶

3.6. Các phép toán trên ma trận¶

3.6.1. Phép chuyển vị¶

3.6.2. Ma trận nghịch đảo.¶

3.6.3. Hạng (rank) của ma trận.¶

3.6.4. Định thức (determinant) của ma trận¶

3.6.5. Trace của ma trận¶

3.6.6. Chuẩn Frobenious¶

3.7. Các phép toán trên ma trận¶

3.7.1. Các phép cộng, trừ¶

3.7.2. Phép nhân ma trận thông thường¶

3.7.3. Tích Hadamard (element-wise product) giữa hai ma trận¶

3.7.4. Nhân ma trận với một véc tơ¶

3.7.5. Nhân ma trận với một scaler¶

3.8. Các phép toán trên véc tơ¶

3.9. Thành phần của mảng¶

3.10. Bài tập¶

3.11. Tài liệu¶