专栏名称: 机器学习研究会

机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织，旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外，协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。

目录

相关文章推荐

黄建同学 · StarVector 是一个由 AI ... · 13 小时前

黄建同学 · Chris Tate 还用v0 ... · 23 小时前

黄建同学 · Agents SDK支持音频： ... · 23 小时前

爱可可-爱生活 · 《爱可可微博热门分享(3.21)》 ... · 昨天

爱可可-爱生活 · 【[260星]Agentic ... · 3 天前

51好读 › 专栏 › 机器学习研究会

【学习】完整手写一个朴素贝叶斯分类器，完成文本分类

机器学习研究会 · 公众号 · AI · 2017-04-04 21:53

正文

点击上方 “机器学习研究会” 可以订阅哦

摘要

转自：数据挖掘入门与实战

Part 1: 本文解决的问题:
我在有这样的一个数据集，里面存放了人们对近期播放电影的评价，当然评价也就分成两部分，好评和差评。我们想利用这些数据训练一个模型，然后可以自动的对影评做出判断，到底是好评还是差评，差评的话，那么我们赶紧删掉它，哈哈。
好吧，这就是自然语言处理领域的基本问题：文本分类。文本分类在我们的日常生活中有非常多的应用，最有名的当属垃圾邮件过滤啦。我们肯定希望不要受到垃圾邮件，但是我们更不希望正常的邮件被当做垃圾邮件过滤掉了。这对我们分类的精度提出了很高的要求。

请到「今天看啥」查看全文

推荐文章

黄建同学 · StarVector 是一个由 AI 驱动的开源基础模型，主要用-20250323080821

13 小时前

黄建同学 · Chris Tate 还用v0 生成了很多更好玩的项目：网页链接-20250322222936

23 小时前

黄建同学 · Agents SDK支持音频： OpenAI还特意提到了，现在他-20250322222955

23 小时前

爱可可-爱生活 · 《爱可可微博热门分享(3.21)》爱可可微博热门分享(3.2-20250321225851

昨天

爱可可-爱生活 · 【[260星]Agentic Radar：为LLM驱动的Agen-20250320142232

3 天前

煮酒论史 · 47岁窦唯潦倒街边吃9元面、骑电动车？他活得比谁都体面！

8 年前

机器学习研究会 · 【预告】北大AI第13讲 NVIDIA AI战略投资中国区负责人董方亮：GPU助力的人工智能时代

7 年前

新华网 · “共享运动仓”来了！能“飞起来”吗？

7 年前

中国医院院长 · 医院这项工作做的不好，院长绩效扣减40%？！

7 年前

史事挖掘机 · 古代四大美女，各有毛病，其中貂蝉最难以启齿

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!