针对交通肇事案件的裁判文书进行事件要素抽取
-
数据来源:OpenLaw
-
预处理:去除标点、注释、冗余词等
-
分词:尝试了词典匹配法、隐马尔科夫模型、jieba、中科院PYNLPIR系统和哈工大LTP系统,最终选取了哈工大LTP系统
-
词性标注、命名实体识别:使用了哈工大LTP系统
-
事件要素抽取:目前使用了CRF模型,不久将加入LSTM等方法
-
应用部分:在上述工作的基础上,增加一些实际应用场景。包括判决结果的预测、案件相似度的比较等
欢迎愿意共同开发的同学加入我们! wechat : shin-sangokumusou