tf.einsum 在TensorFlow 2.x中的應用

一、什麼是tf.einsum

tf.einsum是TensorFlow的一個非常有用的API，這個函數被用於執行Einstein求和約定的張量積運算，可以在不創建中間張量的情況下計算一些高維張量的乘積。

在TensorFlow 1.x中，您需要使用tf.matmul和tf.reduce_sum來執行這些張量的加權求和。但是，TensorFlow 2.x中的tf.einsum使得這項任務更加輕鬆、高效和直觀。


import tensorflow as tf
# 通過使用tf.einsum函數來執行Einstein求和約定的張量積運算
a = tf.constant([1, 2, 3])
b = tf.constant([4, 5, 6])
AB = tf.einsum('a,b->ab', a, b)
print(AB)

二、tf.einsum的語法

tf.einsum接受兩個必需的參數：存儲在張量中的子部分和指定要執行的運算的約定。tf.einsum的基本語法如下所示：


tf.einsum(equation, *inputs)

其中equation是一個Einstein求和約定字符串,而inputs參數指定了一個或多個張量變量，用於執行相應的操作。該equation通常具有如下格式:

‘頂點1,頂點2->頂點3’，其中 , 和 -> 符號之間是輸入的索引，_-> 後面是輸出的索引。

可以使用單個字母或多個字母來指定張量方程中的索引。例如，’a’ 可以表示第一維度；’b’表示第二維度；以此類推。

通常，如果兩個或多個張量共享相同的索引字符，則對應的維度應匹配。

三、tf.einsum的使用場景

1、矩陣相乘(matrix multiplication)

使用tf.einsum實現求兩個矩陣的乘積，可以用以下的式子：

‘ij,jk->ik’

如下所示：


import tensorflow as tf
import numpy as np

a = tf.constant(np.random.rand(3, 4))
b = tf.constant(np.random.rand(4, 2))
c = tf.einsum("ij,jk->ik", a, b)
print(c)

2、矩陣向量乘積(matrix vector multiplication)

如果需要將一個矩陣M乘以向量v，則可以使用以下的等式：

‘ij,j->i’

如下所示：


import tensorflow as tf
import numpy as np

M = tf.constant(np.random.rand(3, 4))
v = tf.constant([1, 2, 3, 4])
result = tf.einsum('ij,j->i', M, v)
print(result)

3、張量相乘、拼接和切片(tensor multiplication, concatenation, slicing)

tf.einsum還可以執行更高級的操作，例如張量的相乘、拼接和切片。以下是一些示例：

張量相乘(tensor multiplication)

在下面的示例中，我們將使用相同大小的3D張量A和B。我們將首先創建一個形狀為[2, 3, 4]的張量，然後進行相乘操作。


    import tensorflow as tf
    import numpy as np
    
    A = np.random.rand(2, 3, 4).astype(np.float32)
    B = np.random.rand(2, 3, 4).astype(np.float32)
    C = tf.einsum("ijk,ijk->ijk", A, B)
    print(C)

張量拼接(concatenation tensors)

兩個大小相同的2D張量的拼接操作, 在下面的示例中，我們將首先創建一個形狀為[2, 3]的張量，然後將其與另一個形狀相同的張量拼接起來。


    import tensorflow as tf
    import numpy as np
    
    A = np.random.rand(2, 3).astype(np.float32)
    B = np.random.rand(2, 3).astype(np.float32)
    C = tf.einsum("ij,kj->ikj", A, B)
    print(C)

張量切片(tensor slicing)

下面這個等式用於從輸入的張量中選擇一個子集：

‘ijk->j’


    import tensorflow as tf
    import numpy as np
    
    A = np.random.rand(2, 3, 4).astype(np.float32)
    C = tf.einsum("ijk->j", A)
    print(C)

四、使用tf.einsum的優勢

與TensorFlow的其他操作相比，tf.einsum有很多好處。其中的一些好處是：

方便性：您可以使用單個字符串操作張量
可讀性：它可以將TensorFlow代碼中的大量矩陣和向量運算變為最簡單易懂的形式
低內存佔用：由於tf.einsum沒有創建中間張量，因此它通常比TensorFlow的其他矩陣和向量運算效率更高。

五、結語

tf.einsum是TensorFlow的一個高效、實用的API，其語法簡單易懂，適用於各種矩陣相乘、拼接和切片等高級操作。通過本文的介紹，我們了解了tf.einsum的語法和使用場景，相信對TensorFlow的學習會更進一步。

原創文章，作者：PHBSV，如若轉載，請註明出處：https://www.506064.com/zh-hk/n/361932.html