自然语言处理NPL 最大概率分词算法

自然语言处理NPL 最大概率分词算法

NLP基于最大概率的汉语切分

Ytinrete

要求:

基于最大概率的汉语切分

目标:采用最大概率法进行汉语切分。

其中:n-gram用bigram,平滑方法至少用Laplace平滑。

输入:接收一个文本,文本名称为:corpus_for_test.txt

输出:切分结果文本,

其中:切分表示:用一个字节的空格“ ”分隔,如:我们 在 学习 。 每个标点符号都单算一个切分单元。

输出文件名为:学号.txt

Bigram参数训练语料:corpus_for_train.txt

注:请严格按此格式输出,以便得到正确评测结果

自然语言处理NPL 最大概率分词算法

特别注意:代码雷同问题

本次作业最后得分会综合考虑:切分性能、代码、文档等几个方面。

第三次作业上交的截止时间:2014 年1月7日24:00

Word文档免费下载Word文档免费下载:自然语言处理NPL 最大概率分词算法 (共21页,当前第1页)

你可能喜欢

  • 中文分词算法
  • Linux操作系统
  • Linux系统命令使用详解
  • Excel使用技巧大全(超
  • 算法设计与分析
  • 搜索算法
  • 算法分析与设计期末

自然语言处理NPL 最大概率分词算法相关文档

最新文档

返回顶部