fastNLP.models.biaffine_parser module

Biaffine Dependency Parser 的 Pytorch 实现.

class fastNLP.models.biaffine_parser.BiaffineParser(embed, pos_vocab_size, pos_emb_dim, num_label, rnn_layers=1, rnn_hidden_size=200, arc_mlp_size=100, label_mlp_size=100, dropout=0.3, encoder='lstm', use_greedy_infer=False)[源代码]

基类:fastNLP.models.biaffine_parser.GraphParser

基类 fastNLP.models.GraphParser

别名 fastNLP.models.BiaffineParser fastNLP.models.biaffine_parser.BiaffineParser

__init__(embed, pos_vocab_size, pos_emb_dim, num_label, rnn_layers=1, rnn_hidden_size=200, arc_mlp_size=100, label_mlp_size=100, dropout=0.3, encoder='lstm', use_greedy_infer=False)[源代码]
参数
  • embed – 单词词典, 可以是 tuple, 包括(num_embedings, embedding_dim), 即 embedding的大小和每个词的维度. 也可以传入 nn.Embedding 对象, 此时就以传入的对象作为embedding

  • pos_vocab_size – part-of-speech 词典大小

  • pos_emb_dim – part-of-speech 向量维度

  • num_label – 边的类别个数

  • rnn_layers – rnn encoder的层数

  • rnn_hidden_size – rnn encoder 的隐状态维度

  • arc_mlp_size – 边预测的MLP维度

  • label_mlp_size – 类别预测的MLP维度

  • dropout – dropout概率.

  • encoder – encoder类别, 可选 (‘lstm’, ‘var-lstm’, ‘transformer’). Default: lstm

  • use_greedy_infer – 是否在inference时使用贪心算法. 若 False , 使用更加精确但相对缓慢的MST算法. Default: False

forward(words1, words2, seq_len, target1=None)[源代码]

模型forward阶段

参数
  • words1 – [batch_size, seq_len] 输入word序列

  • words2 – [batch_size, seq_len] 输入pos序列

  • seq_len – [batch_size, seq_len] 输入序列长度

  • target1 – [batch_size, seq_len] 输入真实标注的heads, 仅在训练阶段有效, 用于训练label分类器. 若为 None , 使用预测的heads输入到label分类器 Default: None

Return dict

parsing 结果:

pred1: [batch_size, seq_len, seq_len] 边预测logits
pred2: [batch_size, seq_len, num_label] label预测logits
pred3: [batch_size, seq_len] heads的预测结果, 在 ``target1=None`` 时预测
static loss(pred1, pred2, target1, target2, seq_len)[源代码]

计算parser的loss

参数
  • pred1 – [batch_size, seq_len, seq_len] 边预测logits

  • pred2 – [batch_size, seq_len, num_label] label预测logits

  • target1 – [batch_size, seq_len] 真实边的标注

  • target2 – [batch_size, seq_len] 真实类别的标注

  • seq_len – [batch_size, seq_len] 真实目标的长度

Return loss

scalar

predict(words1, words2, seq_len)[源代码]

模型预测API

参数
  • words1 – [batch_size, seq_len] 输入word序列

  • words2 – [batch_size, seq_len] 输入pos序列

  • seq_len – [batch_size, seq_len] 输入序列长度

Return dict

parsing 结果:

pred1: [batch_size, seq_len] heads的预测结果
pred2: [batch_size, seq_len, num_label] label预测logits
training: bool
class fastNLP.models.biaffine_parser.GraphParser[源代码]

基类:fastNLP.models.base_model.BaseModel

基类 fastNLP.models.BaseModel

别名 fastNLP.models.GraphParser fastNLP.models.biaffine_parser.GraphParser

基于图的parser base class, 支持贪婪解码和最大生成树解码

static greedy_decoder(arc_matrix, mask=None)[源代码]

贪心解码方式, 输入图, 输出贪心解码的parsing结果, 不保证合法的构成树

参数
  • arc_matrix – [batch, seq_len, seq_len] 输入图矩阵

  • mask – [batch, seq_len] 输入图的padding mask, 有内容的部分为 1, 否则为 0. 若为 None 时, 默认为全1向量. Default: None

Return heads

[batch, seq_len] 每个元素在树中对应的head(parent)预测结果

static mst_decoder(arc_matrix, mask=None)[源代码]

用最大生成树算法, 计算parsing结果, 保证输出合法的树结构

参数
  • arc_matrix – [batch, seq_len, seq_len] 输入图矩阵

  • mask – [batch, seq_len] 输入图的padding mask, 有内容的部分为 1, 否则为 0. 若为 None 时, 默认为全1向量. Default: None

Return heads

[batch, seq_len] 每个元素在树中对应的head(parent)预测结果

training: bool