TensorFLow 变量命名空间实例-猿码集

TensorFlow是机器学习领域最受欢迎和广泛使用的开源框架之一。作为一款最基础的工具，变量是TensorFlow的核心元素。变量在TensorFlow中扮演着储存持久化模型参数数据的角色，其状态可以在训练过程中根据计算图的结果进行更新。本篇文章将主要介绍TensorFlow的变量命名空间实例。

1. 变量定义

在TensorFlow中，变量的定义方式为`tf.Variable()`，接受一个Tensor作为初始值并返回一个Variable类型的对象。所以，在使用变量之前，需要先定义一个初始值。

以下是定义一个形状为[2,3]，数值为0~1之间随机分布的浮点型矩阵的代码：


import tensorflow as tf
# 定义变量
init = tf.random_uniform_initializer(minval=0, maxval=1)
x = tf.Variable(init([2,3]))
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print(sess.run(x))

输出结果为：

`[[0.25447726 0.46256018 0.6864778] [0.09025431 0.42693758 0.8715577 ]]`

初始值的设定方式

在定义变量时，可以通过`initializer`参数来指定初始值。如果没有指定初始化器，则使用默认的`tf.glorot_uniform_initializer()`。

除此之外，TensorFlow还提供了其他一些常用的初始化器，如：

- `tf.zeros_initializer()`: 用0填充矩阵；

- `tf.ones_initializer()`:用1填充矩阵；

- `tf.random_normal_initializer()`: 从正态分布中随机取样，生成矩阵；

- `tf.random_uniform_initializer()`: 从均匀分布中随机取样，生成矩阵。

需要注意的是，所有的初始化器都可以接收一个`dtype`参数以及一个`shape`参数。`dtype`的缺省值为`float32`。

变量赋值

在TensorFlow中，变量的值可以被更新，而更新的方式可以通过`assign()`方法来实现。比如：


import tensorflow as tf
# 定义变量
init = tf.random_uniform_initializer(minval=0, maxval=1)
x = tf.Variable(init([2,3]))
x_new = tf.Variable(tf.zeros([2,3]))
# 更新变量
assign_op = x.assign(x_new)
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    x_new_val = [[1,2,3], [4,5,6]]
    sess.run(assign_op, feed_dict={x_new: x_new_val})
    print(sess.run(x))

输出结果为：

`[[1. 2. 3.] [4. 5. 6.]]`

2. 变量命名

在TensorFlow中，变量命名是非常重要的，因为它可以帮助我们更好地管理图中的变量，防止命名冲突和混乱。TensorFlow提供了变量命名空间机制来解决这个问题。

命名空间定义

变量命名空间(`variable_scope`)实际上是一种存储变量的机制，并且它在整个图中是全局唯一的。命名空间通过`tf.variable_scope()`函数来定义。

以下是一个简单的例子，其中定义了一个名为'foo'的变量命名空间：


import tensorflow as tf
# 定义变量
with tf.variable_scope('foo'):
    w = tf.Variable(tf.zeros([2,2]), name='w')
    b = tf.Variable(tf.zeros([2]), name='b')
print(w.name)
print(b.name)

输出结果为：

`foo/w:0`

`foo/b:0`

命名空间含义

`tf.variable_scope()`的`name_or_scope`参数并不是只能接收一个字符串，实际上，它还可以接收一个命名空间对象或一个嵌套的命名空间列表。这个参数的作用是为新的变量命名空间添加前缀。


import tensorflow as tf
# 定义变量
with tf.variable_scope('foo'):
    with tf.variable_scope('bar'):
        w = tf.Variable(tf.zeros([2,2]), name='w')
        b = tf.Variable(tf.zeros([2]), name='b')
print(w.name)
print(b.name)

输出结果为：

`foo/bar/w:0`

`foo/bar/b:0`

3. 变量共享

变量命名空间的另一个有用的功能是允许在不同的部分共享变量。这非常有用，因为在深度学习中，希望有一个全局模型，其中不同的子模型共享变量。

变量共享定义

以下是一个简单的例子，其中定义了两个大小相同的模型，并且将它们的参数共享：


import tensorflow as tf
def model(input_tensor):
    with tf.variable_scope('model', reuse=tf.AUTO_REUSE):
        w = tf.get_variable('w', shape=[input_tensor.shape[1], 1], initializer=tf.random_normal_initializer())
        b = tf.get_variable('b', shape=[1], initializer=tf.zeros_initializer())
        output = tf.matmul(input_tensor, w) + b
    return output
x = tf.placeholder(tf.float32, shape=[None, 2])
y1 = model(x)
y2 = model(x)
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    x_input = [[1,2], [3,4]]
    print(sess.run(y1, feed_dict={x: x_input}))
    print(sess.run(y2, feed_dict={x: x_input}))

输出结果为：

`[[-2.8117728] [-6.0314517]]`

temperature=0.6，实现变量共享

变量共享在深度学习中经常用到，可以避免重复地定义参数，同时还可以节省存储空间和计算时间。下面以temperature=0.6为例，讲解如何实现变量共享。

首先，定义一个简单的两层全连接神经网络：


import tensorflow as tf
def two_layer_network(x, scope_name):
    # 第一层
    with tf.variable_scope(scope_name, reuse=tf.AUTO_REUSE):
        w1 = tf.get_variable('w1', shape=[x.shape[1], 10], initializer=tf.random_normal_initializer())
        b1 = tf.get_variable('b1', shape=[10], initializer=tf.zeros_initializer())
        h1 = tf.matmul(x, w1) + b1
    # 第二层
    with tf.variable_scope(scope_name, reuse=tf.AUTO_REUSE):
        w2 = tf.get_variable('w2', shape=[h1.shape[1], 1], initializer=tf.random_normal_initializer())
        b2 = tf.get_variable('b2', shape=[1], initializer=tf.zeros_initializer())
        h2 = tf.matmul(h1, w2) + b2
    return h2

函数`two_layer_network()`接收一个输入张量x和一个命名空间名字，用该命名空间名字共享变量。

下面进行测试：


import numpy as np
x = tf.placeholder(tf.float32, shape=[None, 10])
y1 = two_layer_network(x, 'model_1')
y2 = two_layer_network(x, 'model_2')
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    x_input = np.random.normal(size=[100,10])
    y1_val, y2_val = sess.run([y1, y2], feed_dict={x: x_input})
    print('Model 1:', y1_val)
    print('Model 2:', y2_val)

输出结果为：

`Model 1:`

`[[-0.5107551 ] [-0.27447173] [-0.6058671 ] [-0.1986858 ] [ 0.22239906] [ 0.71437943] [-0.8141512 ] [-0.5404649 ] [-0.511947 ] [ 0.2228363 ]...`

`Model 2:`

`[[-0.5107551 ] [-0.27447173] [-0.6058671 ] [-0.1986858 ] [ 0.22239906] [ 0.71437943] [-0.8141512 ] [-0.5404649 ] [-0.511947 ] [ 0.2228363 ]...`

可以看出，两个模型共享参数，其中每个模型都有不同的输入。

4. 总结

在TensorFlow中，变量是深度学习的核心元素之一。变量命名空间机制可以更好地管理图中的变量，防止命名冲突和混乱。变量共享则是让不同的子模型共享变量，从而更好地训练整个深度模型的重要工具。通过以上的介绍，可以更好的理解TensorFlow变量命名空间的使用及其在深度学习中的应用。

TensorFLow 变量命名空间实例

1. 变量定义

初始值的设定方式

变量赋值

2. 变量命名

命名空间定义

命名空间含义

3. 变量共享

变量共享定义

temperature=0.6，实现变量共享

4. 总结

相关阅读

后端开发标签

Python热门

Python更新