专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
宝玉xp  ·  Lex Fridman ... ·  21 小时前  
爱可可-爱生活  ·  【Claude和o3 ... ·  昨天  
爱可可-爱生活  ·  关键或许不在于对抗AI的“幻觉”,而是要重塑 ... ·  昨天  
爱可可-爱生活  ·  晚安~ #晚安# -20250204224327 ·  昨天  
51好读  ›  专栏  ›  机器学习研究会

白话TF-IDF应用(一):自动提取关键词

机器学习研究会  · 公众号  · AI  · 2018-03-23 23:03

正文



点击上方“机器学习研究会”可以订阅哦
摘要
 
转自:机器学习算法与自然语言处理

有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?

这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域,但是出乎意料的是,有一个非常简单的经典算法,可以给出令人相当满意的结果。它简单到都不需要高等数学,普通人只用10分钟就可以理解,这就是我今天想要介绍的TF-IDF算法。





请到「今天看啥」查看全文