簡體   English   中英

訪問幾層預訓練的 DistilBERT 模型的輸出

[英]Access the output of several layers of pretrained DistilBERT model

我正在嘗試從預訓練的“DistilBERT”模型的幾個不同層訪問輸出嵌入。 (“蒸餾酒基未裝箱”)

bert_output = model(input_ids, attention_mask=attention_mask)

bert_output 似乎只返回輸入標記的最后一層的嵌入值。

如果要獲取所有隱藏層的輸出,則需要將output_hidden_states=True kwarg 添加到您的配置中。

你的代碼看起來像

from transformers import DistilBertModel, DistilBertConfig

config = DistilBertConfig.from_pretrained('distilbert-base-cased', output_hidden_states=True)
model = DistilBertModel.from_pretrained('distilbert-base-cased', config=config)

隱藏層將作為bert_output[2]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM