tf.summary的完全解讀

TensorFlow提供了很多機制來對模型進行可視化，其中一個強大的機制是tf.summary。tf.summary提供了一系列的函數，可以記錄summary信息，以便於在TensorBoard中進行展示和調試。在這篇文章中，我們將從多個方面對tf.summary進行詳細的闡述。

一、tf.summary內存

tf.summary記錄的信息在內存中存儲，即在模型訓練過程中會不斷的產生summary信息，這些信息會被累積在內存中，分散輸出並不容易管理。可以通過下面兩種方式來避免內存過多：1.使用tf.summary.FileWriter，在定義的時候設置max_queue和flush_secs參數，可以讓數據定期的寫入磁盤，釋放內存；2.使用tf.summary.create_no_op操作，來創建一個空的操作，避免數據佔據過多內存。

二、tf.summary.merge_all()

tf.summary.merge_all()是一個核心函數，它可以將所有採集的事件合併成一個tensor，這樣可以同時運行多個採集操作。tf.summary.merge_all()合併的過程是針對所有可採集的事件，而tf.summary.merge函數是針對單獨一個事件進行合併。例如：

summary_op = tf.summary.merge_all() # 合併所有可採集事件
sum_train_op = tf.summary.merge([loss_summary, acc_summary]) # 合併單獨事件

三、tf.summary.scalar

tf.summary.scalar用於記錄標量信息，統計各個node輸出tensor的標量值，在瀏覽器顯示如下：

這裡是一個示例代碼，記錄了模型的loss和acc信息：

loss_summary = tf.summary.scalar('loss', loss)
acc_summary = tf.summary.scalar('accuracy', accuracy)

四、tf.summary.histogram

tf.summary.histogram用於記錄張量的取值分布，是一種記錄時序數據的好方法。在TensorBoard的Scalar面板下會展示大量的數據，使用SketchPad的方式，可以；在TensorBoard的Histogram面板下會展示取值分布，如下圖所示：

下面是一個示例代碼，記錄全局參數的取值分布：

for i, variable in enumerate(tf.trainable_variables()):
   tf.summary.histogram("weights_{}".format(i), variable)

五、tf.summary.image

在訓練CNN的時候，可以使用tf.summary.image來記錄輸入圖片和卷積層輸出的feature map，使模型的可視化更為直觀。在TensorBoard的Images面板下展示，如下圖所示：

下面是一個示例代碼，記錄卷積層的輸出：

conv1_reshape = tf.reshape(conv1_output, [-1, 28, 28, 32])
tf.summary.image('Conv1', conv1_reshape, max_outputs=10)

六、tf.summary.FileWriter

tf.summary.FileWriter用於將所有採集到的事件寫入到磁盤中。其中graph參數用於顯示計算圖，logdir參數表示日誌存儲位置。在啟動TensorBoard的命令時，可以指定一個或多個日誌目錄，TensorBoard會將所有日誌組合在一起，並顯示可視化的結果。

train_writer = tf.summary.FileWriter(log_dir + '/train', sess.graph)
test_writer = tf.summary.FileWriter(log_dir + '/test')
merged = tf.summary.merge_all()
session.run(tf.global_variables_initializer())
for i in range(1000):
    batch = mnist.train.next_batch(100)
    summary, _= session.run([merged,  optimizer], feed_dict={x: batch[0], y_: batch[1], keep_prob: 0.5})
    train_writer.add_summary(summary, i)
    if i % 10 == 0:
        summary, acc = session.run([merged, accuracy], feed_dict={x: mnist.test.images, y_: mnist.test.labels, keep_prob: 1.0})
        test_writer.add_summary(summary, i)
        print('accuracy at step %s: %s' % (i, acc))
train_writer.close()
test_writer.close()

七、tf.summary.create

在定義變量的時候，可以通過tf.summary.create來對關鍵節點進行診斷，幫助我們快速發現問題。下面是一個示例代碼，記錄梯度和權重信息：

# compute gradients
var_grads = tf.gradients(loss, variables)
for grad, var in zip(var_grads, variables):
    tf.summary.histogram(var.name + '/gradient', grad)
    tf.summary.histogram(var.name + '/weight', var)

結語

以上就是對於tf.summary的詳細解讀，通過使用tf.summary我們可以更加清晰的了解模型的訓練情況，定位問題，提高模型的可視化能力和調試效率。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/241866.html