PyTorch使用手册

基本数据结构Tensor

PyTorch中主要使用的数据结构是N维数组（张量, Tensor）:

0-d: 常用于表示一个列别，例如1.0
1-d: 常用于表示一个特征向量，例如[1.0, 2.7, 3.4]
2-d: 常用于表示整个样本，即特征矩阵，例如[[1.0, 2.7, 3.4], [5.0, 0.2, 4.6], …]
3-d: 常用于表示一个三通道RGB图片，当然也可以展平为一个特征向量（宽×高×通道）
4-d: 常用于表示一组RGB图片或视频（批量大小×宽×高×通道，时间×宽×高×通道）
5-d: 常用于表示视频批量（批量大小×时间×宽×高×通道）

在PyTorch中创建一个数组需要指定三个特征：形状、数据类型、数据初始值。

构造Constructor

# From list / NumPy array
>>> x = torch.tensor([[1, -1], [-1, 1]])
>>> x = torch.from_numpy(np.array([[1, -1], [-1, 1]]))
tensor([[ 1, -1],
        [-1,  1]])

# From Pandas
>>> x = torch.tensor(pd_data.values)
tensor([[ 1, -1],
        [-1,  1]])

# Range (Like Python function range()) tensor (1-d)
>>> x = torch.arange(10)
tensor([0, 1, 2, 3, 4])

# Zero tensor
>>> x = torch.zeros([2, 2])
tensor([[0., 0.],
        [0., 0.]])

# Unit tensor
>>> x = torch.ones([1, 2, 5])
tensor([[[1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1.]]])

访问Access

类似于Numpy的访问，可以通过如下形式进行：

>>> x = torch.ones([2, 3, 4])
>>> x[:,:,-1]

操作Operators

shape & numel() : 表示Tensor张量的维度和元素总数

>>> x = torch.zeros([1, 2, 3])
>>> x.shape
torch.Size([1, 2, 3])

>>> x = torch.zeros([1, 2, 3])
>>> x.numel()
6

reshape(arg): 改变张量的形状和不改变元素数量和值

>>> x = torch.arange(12, dtype=torch.float32)
>>> x.reshape([3,4])
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])

squeeze(arg): 表示第arg维的维度值为1，则去掉该维度。否则tensor不变。（即若tensor.shape[arg] = 1，则去掉该维度）

>>> x = torch.zeros([1, 2, 3])
>>> x = x.squeeze(0)
>>> x.shape
torch.Size([2, 3])

unsqueeze(arg): 表示在第arg维增加一个维度值为1的维度

>>> x = torch.zeros([2, 3])
>>> x.shape
torch.Size([2, 3])

>>> x = x.unsqueeze(1)
>>> x.shape
torch.Size([2, 1, 3])

transpose(arg): 矩阵转置

>>> x = torch.zeros([2, 3])
>>> x.shape
torch.Size([2, 3])

>>> x = x.transpose(0, 1)
>>> x.shape
torch.Size([3, 2])

cat(arg): 矩阵连接，注意在拼接时，其他维度的长度应该一致

>>> x = torch.zeros([2, 1, 3])
>>> y = torch.zeros([2, 3, 3])
>>> z = torch.zeros([2, 2, 3])
>>> w = torch.cat([x, y, z], dim=1)
>>> w.shape
torch.Size([2, 6, 3])

其他操作

z = x + y  # Addition
z = x - y  # Subtraction
z = x * y  # Inner Product
z = x / y  # Divide
y = x.pow(2) # Power
y = x.sum(axis=[0,1], keepdims=True)  # Summation
y = x.mean(axis=[0,1], keepdims=True)  # Mean
z = torch.dot(x, y) # Vector dot Vector, equals torch.sum(x * y)
z = torch.mv(A, x) # Matrix dot Vector
Z = torch.mm(A, B) # Matrix dot Matrix
u = torch.norm(a) # L2 Normalization
x == y  # Boolean Tensor

广播机制

对于维度相同，但各个维度的大小不同的张量，PyTorch利用广播机制进行Tensor运算。

>>> a = torch.arange(3).reshape([3,1])
>>> b = torch.arange(2).reshape([1,2])
>>> a, b, a + b # 此时a,b的尺寸都会自动复制到[3,2]做运算
tensor([[0],
        [1],
        [2]])
tensor([[0, 1]])
tensor([[0, 1],
        [1, 2],
        [2, 3]])

内存重新分配

>>> before = id(y)
>>> y = y + x
>>> id(y) == before
False

>>> before = id(y)
>>> y += x
>>> id(y) == before
True

使用设备Devices

tensor = torch.ones([3, 4]).to('cuda' torch.cuda.is_available() else 'cpu')
model = resnet50().to('cuda' torch.cuda.is_available() else 'cpu')
# nvidia-smi

计算微分Gradient

>>> x = torch.tensor([[1., 0.], [-1., 1.]], requires_grad=True) 
>>> z = x.pow(2).sum()
>>> z.backward()
>>> x.grad
tensor([[ 2., 0.], [-2., 2.]])

数据转换

list 转 numpy：ndarray = np.array(list)
numpy 转 list: list = ndarray.tolist()
list 转 Tensor: tensor = torch.Tensor(list)
Tensor 转 list: list = tensor.numpy().tolist()
Tensor 转 numpy: ndarray = tensor.cpu().numpy()
numpy 转 Tensor: tensor = torch.from_numpy(ndarray)

数据预处理

利用Pandas读入CSV

>>> import pandas as pd
>>> data = pd.read_csv(data_file)
>>> print(data)
   NumRooms Alley   Price
0       NaN  Pave  127500
1       2.0   NaN  106000
2       4.0   NaN  178100
3       NaN   NaN  140000

Pandas分片

>>> inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
   NumRooms Alley   Price
0       NaN  Pave  127500
1       2.0   NaN  106000
2       4.0   NaN  178100
3       NaN   NaN  140000

处理缺失值

>>> inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
>>> inputs = inputs.fillna(inputs.mean())
>>> print(inputs)
   NumRooms Alley
0       3.0  Pave
1       2.0   NaN
2       4.0   NaN
3       3.0   NaN

OneHot

>>> inputs = pd.get_dummies(inputs, dummy_na=True)
>>> print(inputs)
   NumRooms  Alley_Pave  Alley_nan
0       3.0           1          0
1       2.0           0          1
2       4.0           0          1
3       3.0           0          1

DNN过程

定义Dataset & Dataloader

from torch.utils.data import Dataset, DataLoader

class MyDataset(Dataset):
    def __init__(self, file):
        self.data = ...
        
    def __getitem__(self, index):
        return self.data[index]
        
    def __len__(self):
        return len(self.data)


dataset = MyDataset(file)
dataloader = DataLoader(dataset, batch_size, shuffle=True)

定义Neural Network Layers

import torch.nn as nn

class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        self.net = nn.Sequential(
            nn.Linear(10, 32), # Fully-connected Layer
            nn.Sigmoid(), # nn.ReLU()
            nn.Linear(32, 1)  # Fully-connected Layer
        )
        self.criterion = nn.MSELoss() #nn.CrossEntropyLoss()

    def forward(self, x):
        return self.net(x)
        
    def call_loss(self, predict, target):
        return self.criterion(predict, target)


torch.optim.SGD(model.parameters(), lr=0.01, momentum=0.9)

训练过程Trainning

dataset = MyDataset(file)
tr_set = DataLoader(dataset, 16, shuffle=True)
model = MyModel().to(device)
criterion = nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), 0.1)

for epoch in range(n_epochs):
    #Training Set
    model.train()
    for x, y in tr_set:
        optimizer.zero_grad()
        x, y = x.to(device), y.to(device)
        pred = model(x)
        loss = criterion(pred, y)
        loss.backward()
        optimizer.step()
        
    #Validation Set
    model.eval()
    total_loss = 0
    for x, y in dv_set:
        x, y = x.to(device), y.to(device)
        with torch.no_grad():
            pred = model(x)
            loss = criterion(pred, y)
            total_loss += loss.cpu().item() * len(x)
    avg_loss = total_loss / len(dv_set.dataset)

    #Testing Set
    model.eval()
    preds = []
    for x in tt_set: x = x.to(device)
        with torch.no_grad():
        pred = model(x)
        preds.append(pred.cpu())

模型的保存与载入

# Save
torch.save(model.state_dict(), path)

# Load
ckpt = torch.load(path)
model.load_state_dict(ckpt)

Regression样例

import csv
import numpy as np
import torch
from torch.utils.data import Dataset, DataLoader


class Covid19Dataset(torch.utils.data.Dataset):
    data: torch.Tensor()
    target: torch.Tensor()
    mode: str

    def __init__(self, path, mode):
        with open(path, 'r') as fp:
            source = np.array(list(csv.reader(fp))[1:])[:, 1:].astype(float)
            if mode == 'train':
                self.data = torch.FloatTensor(source)[:, list(range(93))]
                self.target = torch.FloatTensor(source)[:, -1]
                self.mode = 'train'
            elif mode == 'dev':
                self.data = torch.FloatTensor(source)[::5, list(range(93))]
                self.target = torch.FloatTensor(source)[::5, -1]
                self.mode = 'dev'
            elif mode == 'test':
                self.data = torch.FloatTensor(source)[:, list(range(93))]
                self.mode = 'test'
            else:
                raise Exception("mode error")

        self.data[:, 40:] = \
            (self.data[:, 40:] - self.data[:, 40:].mean(dim=0, keepdim=True)) \
            / self.data[:, 40:].std(dim=0, keepdim=True)

    def __getitem__(self, index):
        if not self.mode == 'test':
            return self.data[index], self.target[index]
        else:
            return self.data[index]

    def __len__(self):
        return len(self.data)


class RegressionModel(torch.nn.Module):
    net: torch.nn.Sequential()
    criterion: torch.nn.MSELoss()

    def __init__(self, n_feature, n_hidden, n_ouput):
        super(RegressionModel, self).__init__()
        self.net = torch.nn.Sequential(
            torch.nn.Linear(n_feature, n_hidden),
            torch.nn.ReLU(),
            torch.nn.Linear(n_hidden, n_ouput)
        )
        self.criterion = torch.nn.MSELoss(reduction="mean")

    def forward(self, x):
        return self.net(x).squeeze(1)

    def loss(self, predict, target):
        return self.criterion(predict, target)


tr_set = DataLoader(dataset=Covid19Dataset(path='../data/covid.train.csv', mode='train'), batch_size=300, shuffle=True)
dev_set = DataLoader(dataset=Covid19Dataset(path='../data/covid.train.csv', mode='dev'), batch_size=300, shuffle=True)
test_set = DataLoader(dataset=Covid19Dataset(path='../data/covid.test.csv', mode='test'), batch_size=300, shuffle=False)

model = RegressionModel(n_feature=93, n_hidden=256, n_ouput=1)
optimizer = torch.optim.SGD(model.parameters(), lr=0.001, momentum=0.9)

min_mse = 1000

for epoch in range(3000):
    model.train()
    for x, y in tr_set:
        optimizer.zero_grad()
        pred = model(x)
        loss = model.loss(pred, y)
        loss.backward()
        optimizer.step()

    model.eval()
    total_loss = 0
    for x, y in dev_set:
        with torch.no_grad():
            pred = model(x)
            loss = model.loss(pred, y)
        total_loss += loss.detach().item() * len(x)
    total_loss = total_loss / len(tr_set.dataset)
    if min_mse > total_loss:
        min_mse = total_loss
        torch.save(model.state_dict(), 'regression_model')
        print("train {}, loss {:.5f}".format(epoch, min_mse))

model.eval()
preds = []
for x in test_set:
    with torch.no_grad():
        pred = model(x)
        preds.append(pred.detach().cpu())
preds = torch.cat(preds, dim=0).numpy()
print(preds)

RyanCheung Ignition sequence start

PyTorch使用手册

基本数据结构Tensor

构造Constructor

访问Access

操作Operators

使用设备Devices

计算微分Gradient

数据转换

数据预处理

DNN过程

定义Dataset & Dataloader

定义Neural Network Layers

训练过程Trainning

模型的保存与载入

Regression样例

参考链接