高級API、異構(gòu)圖：谷歌發(fā)布TF-GNN，在TensorFlow創(chuàng)建圖神經(jīng)網(wǎng)絡(luò)

作者：機器之心報道 2021-11-19 17:18:39

今天，TensorFlow 官方博客發(fā)布了 TensorFlow Graph Neural Networks（TensorFlow GNN）庫，這個庫使得用戶在使用 TensorFlow 時能夠輕松處理圖結(jié)構(gòu)數(shù)據(jù)。

[[435974]]

此前，TensorFlow GNN 的早期版本已經(jīng)在谷歌的各種應(yīng)用中使用，包括垃圾郵件和異常檢測、流量估計、YouTube 內(nèi)容標記等。特別是，考慮到谷歌數(shù)據(jù)種類繁多，該庫在設(shè)計時就考慮到了異構(gòu)圖。

高級API、異構(gòu)圖：谷歌發(fā)布TF-GNN，在TensorFlow創(chuàng)建圖神經(jīng)網(wǎng)絡(luò)

項目地址：https://github.com/tensorflow/gnn

為何使用 GNN？

無論是在現(xiàn)實世界中，還是在我們設(shè)計的系統(tǒng)中，圖無處不在。一組對象或是不同的人以及他們之間的聯(lián)系，通常可以用圖來描述。通常情況下，機器學(xué)習(xí)中的數(shù)據(jù)是結(jié)構(gòu)化或關(guān)系型的，因此也可以用圖來描述。雖然 GNN 的基礎(chǔ)研究已經(jīng)有幾十年的歷史，但近幾年才取得一些進展，包括在交通預(yù)測、假新聞檢測、疾病傳播建模、物理模擬，以及理解為什么分子會有氣味等。

圖可以為不同類型的數(shù)據(jù)進行關(guān)系建模，包括網(wǎng)頁（左）、社交關(guān)系（中）或分子（右）。

怎樣定義圖呢？簡單來講，圖表示一組實體（節(jié)點或頂點）之間的關(guān)系（邊）。我們可以描述每個節(jié)點、邊或整個圖，從而將信息存儲在圖的每一部分中。此外，我們可以賦予圖邊緣方向性來描述信息或信息流。

GNN 可以用來回答關(guān)于這些圖的多個特征問題。GNN 可用于節(jié)點級任務(wù)，對圖的節(jié)點進行分類，并預(yù)測圖中的分區(qū)和相關(guān)性，類似于圖像分類或分割。最后，我們可以在邊緣級別使用 GNN 來發(fā)現(xiàn)實體之間的連接。

TensorFlow GNN

TF-GNN（TensorFlow GNN）提供了在 TensorFlow 中實現(xiàn) GNN 模型的構(gòu)建塊。除了建模 API 之外，該庫還為處理圖數(shù)據(jù)提供了可用工具，包括基于張量的圖數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)處理 pipeline 和一些供用戶快速入門的示例模型。

TF-GNN 工作流程組件

TF-GNN 庫的初始版本包含許多實用程序和功能，供初學(xué)者和有經(jīng)驗的用戶使用，包括：

高級 keras 風(fēng)格的 API 用于創(chuàng)建 GNN 模型，可以很容易地與其他類型的模型組合。GNN 通常與排序、深度檢索結(jié)合使用或與其他類型的模型（圖像、文本等）混合使用；
定義良好的模式用來聲明圖拓撲結(jié)構(gòu)，以及驗證工具。該模式描述了其訓(xùn)練數(shù)據(jù)的大小，并用于指導(dǎo)其他工具；
GraphTensor 復(fù)合張量類型，可以用來保存圖數(shù)據(jù)，也可以進行批處理，并具有可用的圖操作例程；
GraphTensor 結(jié)構(gòu)操作庫：在節(jié)點和邊緣上進行各種有效的 broadcast 和 pooling 操作，以及提供相關(guān)操作的工具；標準 baked 卷積庫，機器學(xué)習(xí)工程師、研究人員可以對其輕松擴展；高級 API 可以幫助工程師快速構(gòu)建 GNN 模型而不必擔(dān)心細節(jié)；
模型可以從圖訓(xùn)練數(shù)據(jù)編碼，以及用于將此數(shù)據(jù)解析為數(shù)據(jù)結(jié)構(gòu)的庫中提取各種特征。

示例

下面示例使用 TF-GNN Keras API 構(gòu)建了一個模型，該模型可以根據(jù)觀看內(nèi)容和喜歡的類型向用戶推薦電影。

完成這項任務(wù)使用 ConvGNNBuilder 方法來指定邊的類型和節(jié)點配置，即對邊使用 WeightedSumConvolution（定義如下）：

import tensorflow as tf 
    import tensorflow_gnn as tfgnn 
 
    # Model hyper-parameters: 
    h_dims = {'user': 256, 'movie': 64, 'genre': 128} 
 
    # Model builder initialization: 
    gnn = tfgnn.keras.ConvGNNBuilder( 
      lambda edge_set_name: WeightedSumConvolution(), 
      lambda node_set_name: tfgnn.keras.layers.NextStateFromConcat( 
         tf.keras.layers.Dense(h_dims[node_set_name])) 
    ) 
 
    # Two rounds of message passing to target node sets: 
    model = tf.keras.models.Sequential([ 
        gnn.Convolve({'genre'}),  # sends messages from movie to genre 
        gnn.Convolve({'user'}),  # sends messages from movie and genre to users 
        tfgnn.keras.layers.Readout(node_set_name="user"), 
        tf.keras.layers.Dense(1) 
    ])

有時我們希望 GNN 性能更強大，例如，在上個示例中，我們可能希望模型在給出推薦電影時可以同時給出權(quán)重。下面代碼片段中定義了一個更高級的 GNN，它帶有自定義圖卷積，以及帶有權(quán)重邊。下面代碼定義了 WeightedSumConvolution 類可以將邊值池化為所有邊的權(quán)重總和：

class WeightedSumConvolution(tf.keras.layers.Layer): 
  """Weighted sum of source nodes states.""" 
 
  def call(self, graph: tfgnn.GraphTensor, 
           edge_set_name: tfgnn.EdgeSetName) -> tfgnn.Field: 
    messages = tfgnn.broadcast_node_to_edges( 
        graph, 
        edge_set_name, 
        tfgnn.SOURCE, 
        feature_name=tfgnn.DEFAULT_STATE_NAME) 
    weights = graph.edge_sets[edge_set_name]['weight'] 
    weighted_messages = tf.expand_dims(weights, -1) * messages 
    pooled_messages = tfgnn.pool_edges_to_node( 
        graph, 
        edge_set_name, 
        tfgnn.TARGET, 
        reduce_type='sum', 
        feature_value=weighted_messages) 
    return pooled_messages

請注意，即使卷積是在只考慮源節(jié)點和目標節(jié)點的情況下編寫的，TF-GNN 仍可確保它適用并可以無縫處理異構(gòu)圖（具有各種類型的節(jié)點和邊）。

安裝

這是目前安裝 tensorflow_gnn 的唯一方法。強烈建議使用虛擬環(huán)境。

Clone tensorflow_gnn：

$> git clone https://github.com/tensorflow/gnn.git tensorflow_gnn

安裝 TensorFlow：

$> pip install tensorflow

安裝 Bazel：Bazel 需要構(gòu)建包的源代碼。安裝步驟請參考：https://docs.bazel.build/versions/main/install.html

安裝 GraphViz：這個包使用 GraphViz 作為可視化工具，安裝因操作系統(tǒng)而異，例如 Ubuntu：

$> sudo apt-get install graphviz graphviz-dev

安裝 tensorflow_gnn：

$> cd tensorflow_gnn && python3 -m pip install .

責(zé)任編輯：張燕妮來源：機器之心Pro

谷歌 TensorFlow 技術(shù)