Python - 词干算法
-
简述
在自然语言处理领域,我们遇到两个或多个单词有共同词根的情况。例如,同意、同意和同意这三个词具有相同的词根同意。涉及这些词中的任何一个的搜索都应将它们视为同一个词,即根词。因此,将所有单词链接到它们的词根就变得至关重要。NLTK 库具有执行此链接并提供显示根词的输出的方法。nltk 中提供了三种最常用的词干提取算法。它们给出的结果略有不同。下面的示例显示了所有三种词干算法的使用及其结果。当我们运行上述程序时,我们得到以下输出 -