信息抽取学习 MSRA-NER bs=16, lr=2e-5, crf_lr=0.1, num_train_epochs=5 方法 f p r bert + softmax 95.03% 94.60% 95.45% bert + crf 95.31% 95.28% 95.33%