实例详解Pytorch中的tensor数据结构-猿码集

1. Pytorch中的Tensor数据结构

Pytorch是一个基于Python的开源机器学习库，主要用于语义理解、自然语言生成、图像识别、图像生成、推荐系统等领域。在Pytorch中，Tensor是基础数据类型之一，Tensor可以看作是多维数组，支持GPU加速计算，并且可以计算梯度，是深度学习框架中非常重要的基础数据类型。

2. 创建和操作Tensor

2.1 创建Tensor

在Pytorch中创建Tensor可以使用torch.Tensor()函数，以下是一些创建Tensor的方法：


import torch
# 创建空的Tensor
a = torch.Tensor()
print(a)
# 创建一个1*3的Tensor
b = torch.Tensor([1, 2, 3])
print(b)
# 创建一个2*3的Tensor，并且所有元素初始化为0
c = torch.zeros(2, 3)
print(c)
# 创建一个2*3的Tensor，并且所有元素初始化为1
d = torch.ones(2, 3)
print(d)
# 创建一个2*3的Tensor，并且所有元素初始化为随机数
e = torch.rand(2, 3)
print(e)

以上是几种创建Tensor的方法，可以看到通过Tensor()函数创建Tensor非常容易，同时也可以指定Tensor的形状和初始化方式。

2.2 操作Tensor

对于创建好的Tensor，我们可以对它进行各种操作，比如维度变换、数学运算等。

2.2.1 维度变换

将一个Tensor变换成另一个形状的Tensor可以使用view()函数，该函数可以根据指定的参数，将一个Tensor转换成一个新的Tensor，新的Tensor的形状可以与原来不同，但是新的Tensor和原来的Tensor共享数据内存。


import torch
a = torch.Tensor([[1, 2], [3, 4], [5, 6]])
print(a.shape)  # (3, 2)
b = a.view(2, 3)
print(b)
print(b.shape)  # (2, 3)
c = b.view(-1)
print(c.shape)  # (6,)

在上面的例子中，我们对一个3\*2的Tensor进行了两次变换，第一次变成了一个2\*3的Tensor，第二次变成了一个一维的Tensor。可以看到，在第二次变换中，我们使用了-1这个参数，这个参数表示根据其他维度自动计算当前维度的大小，这样可以方便地进行维度变换。

2.2.2 数学运算

在Pytorch中，Tensor也支持各种数学运算，包括加减乘除、点乘、矩阵乘法、平方、开方等。


import torch
a = torch.Tensor([[1, 2], [3, 4]])
b = torch.Tensor([[5, 6], [7, 8]])
c = a + b
print(c)
d = torch.mm(a, b)
print(d)
e = torch.dot(torch.Tensor([1, 2]), torch.Tensor([3, 4]))
print(e)
f = torch.sin(torch.Tensor([0.5]))
print(f)

可以看到，在Pytorch中进行数学运算也非常容易，大部分运算都可以直接使用函数完成，同时支持Tensor之间的直接运算。

3. Tensor的应用

在深度学习中，Tensor是非常重要的数据类型，尤其是在卷积神经网络、循环神经网络等领域。下面是一个简单的例子，使用Tensor实现一个基于卷积神经网络的手写数字识别模型。

3.1 加载MNIST数据集

我们使用Pytorch内置的MNIST数据集，这是一个非常常用的手写数字识别数据集，该数据集包含60000张训练图片和10000张测试图片。


import torch
import torchvision.datasets as dset
import torchvision.transforms as transforms
# 定义一个transform，用于对数据进行预处理
transform = transforms.Compose([
    transforms.ToTensor(),  # 将图片转换成Tensor
    transforms.Normalize((0.1307,), (0.3081,))  # 对图片进行标准化
])
# 下载MNIST数据集
train_set = dset.MNIST(root='./data', train=True, transform=transform, download=True)
test_set = dset.MNIST(root='./data', train=False, transform=transform, download=True)
# 创建dataloader
train_loader = torch.utils.data.DataLoader(train_set, batch_size=64, shuffle=True)
test_loader = torch.utils.data.DataLoader(test_set, batch_size=64, shuffle=False)

3.2 创建卷积神经网络模型

在这个例子中，我们创建一个非常简单的卷积神经网络模型，包含两个卷积层和两个全连接层。


import torch.nn as nn
import torch.nn.functional as F
class Net(nn.Module):
    def __init__(self):
        super().__init__()
        
        self.conv1 = nn.Conv2d(1, 16, kernel_size=5, padding=2)
        self.conv2 = nn.Conv2d(16, 32, kernel_size=5, padding=2)
        self.fc1 = nn.Linear(32 * 7 * 7, 100)
        self.fc2 = nn.Linear(100, 10)
        
    def forward(self, x):
        x = F.relu(self.conv1(x))
        x = F.max_pool2d(x, 2)
        x = F.relu(self.conv2(x))
        x = F.max_pool2d(x, 2)
        x = x.view(-1, 32 * 7 * 7)
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        
        return x
net = Net()
print(net)

可以看到，我们定义了一个名为Net的类，这个类继承自nn.Module，这是Pytorch中模型的基类。在Net类的构造函数中，我们定义了卷积层、全连接层等模型参数。在Net类的forward()函数中，我们定义了模型的前向传播过程，包括卷积、激活、池化等操作。

3.3 定义损失函数和优化器

在训练模型的过程中，我们需要定义损失函数和优化器，损失函数用于评估模型的预测结果和真实结果的差异，优化器用于更新模型参数。


import torch.optim as optim
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.01, momentum=0.9)

在这个例子中，我们使用了交叉熵损失函数和随机梯度下降优化器。

3.4 训练模型

有了数据、模型、损失函数和优化器后，我们就可以开始训练模型了。以下是训练模型的代码：


# 训练模型
for epoch in range(10):
    running_loss = 0.
    
    for i, data in enumerate(train_loader, 0):
        inputs, labels = data
        
        optimizer.zero_grad()
        
        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        
        running_loss += loss.item()
        
        if i % 100 == 99:
            print('[%d, %5d] loss: %.3f' % (epoch + 1, i + 1, running_loss / 100))
            running_loss = 0.

在这个例子中，我们循环10个epoch，每个epoch中循环训练所有数据一次。在每个epoch的循环中，我们先将梯度清零，然后使用模型进行前向传播，计算损失，进行反向传播，更新模型参数。

3.5 测试模型

训练模型之后，我们需要对模型进行测试，评估模型在测试集上的准确率。


# 测试模型
correct = 0
total = 0
with torch.no_grad():
    for data in test_loader:
        inputs, labels = data
        outputs = net(inputs)
        _, predicted = torch.max(outputs.data, 1)  # 取得分最高的类别
        total += labels.size(0)
        correct += (predicted == labels).sum().item()
print('Accuracy on test set: %.2f %%' % (100 * correct / total))

在这个例子中，我们循环测试所有数据，在每个数据上计算模型的输出，然后查找输出中得分最高的类别，并将其与真实标签进行比较以计算准确率。

4. 总结

在这篇文章中，我们深入介绍了Pytorch中的Tensor数据结构，包括创建Tensor、维度变换、数学运算等操作。同时，我们使用Tensor实现了一个基于卷积神经网络的手写数字识别模型，涵盖了Pytorch中深度学习的主要应用场景。通过这篇文章的学习，希望读者能够深入了解Pytorch中的Tensor数据结构，并掌握如何使用Tensor进行深度学习任务。

实例详解Pytorch中的tensor数据结构