讲解题目,并教会我如何理解记忆---TF-IDF算法 示例: 假如有如下文档 "在山里,孩子们能享受的快乐只有大山和水,多数时候孩子们都是快乐的,他们的想法都是简单且容易满足的,他们总是期望了解大山外面的世界。" “孩子们” “快乐” “都是” “他们” “大山” > 5个词的TF值都为0.033。(出现次数都是2, 文档总词数是60) 假设文档集共有2000篇文档, 出现上面5个词的文档数分别为60、30、250、200、20。则每个词的IDF值分别为1.516、1.810、0.901、0.998、1.979。 > 5个词语的TF-IDF值: 0.0500, 0.0597, 0.0297,0.0329, 0.0653 > 选取前3个词作为该文档的关键词, 即“大山”“快乐”“孩子们”

视频信息