0%

cs224n-2.使用神经网络解决nlp问题

神经网络介绍

神经网络介绍部分省略

命名实体识别(NER)

标注中句子中的目标词性词语-实体,其中实体是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等

命名实体存在的困难:

  1. 难以确定实体的上下文边界(王小明 还是 小明)
  2. 难以确定词语是否为 实体
  3. 实体的具体含义依赖于上下文,难以确定
  4. 难以辨别不知道的实体(特定语境 特定环境下的某些词作为实体)

1.Binary word window classification

由于词语根据语境等具有不同的含义和词性,单独识别句子中的某个单词是不现实的,使用一个上下文窗口对词语进行分类

思路: 使用上下文窗口中的背景词对当前词进行分类

  • 对窗口内词向量进行平均,作为分类输入。问题:忽略了位置信息和词语之间的关系

  • 使用窗口内词向量拼接向量作为输入

训练分类函数

  1. softmax 或者 交叉熵函数,通过反向传播更新词向量和权重

  2. unnormarlized score

    • 选取一个正例窗口和一个反例窗口

    • 将拼接的窗口向量输入到具有一个隐藏层和一个全连接输出层的神经网络,输出一个评价分数(score)

      • 添加隐藏层的目的在于通过隐藏层的非线性激活函数,学习输入与输出之间的非线性关系(non-linear interaction)
    • 训练目标为:正例窗口分数最大,负例窗口分数最小