Python - 文本分类
-
简述
很多时候,我们需要通过一些预定义的标准将可用文本分类为各种类别。nltk 提供了这样的功能作为各种语料库的一部分。在下面的示例中,我们查看电影评论语料库并检查可用的分类。当我们运行上述程序时,我们得到以下输出 -现在让我们来看看其中一个带有正面评价的文件的内容。此文件中的句子已标记化,我们打印前四个句子以查看示例。当我们运行上述程序时,我们得到以下输出 -接下来,我们对每个文件中的单词进行标记,并使用 nltk 中的 FreqDist 函数找到最常见的单词。当我们运行上述程序时,我们得到以下输出 -