专栏名称: 橘子汽水铺
橘子汽水铺 by orange.ai。 AI创始人, AI投资人,AI产品经理都在关注的AI科技自媒体。 聚焦最有商业价值的AI资讯,分享一线的AI产品经理经验。
目录
相关文章推荐
Quora文选英语  ·  老外说𝒐𝒖𝒕 𝒐𝒇 ... ·  17 小时前  
Quora文选英语  ·  老外说𝒕𝒂𝒍𝒌 𝒕𝒐 𝒕𝒉𝒆 ... ·  昨天  
知乎日报  ·  知乎瞎扯|你捡过最大的漏是什么? ·  2 天前  
知乎日报  ·  票房已突破 26 亿,如何评价《唐探 1900》? ·  3 天前  
51好读  ›  专栏  ›  橘子汽水铺

AI 搜索新产品 Genspark 实测,融资 6000 万美金,实际效果如何?

橘子汽水铺  · 公众号  ·  · 2024-06-21 07:05

正文

引言

昨天,Genspark 融资6000万美金的消息传遍微信群。一个新晋的AI搜索产品,竟然能拿到这么高的融资,而且这个消息经过线人确认,准确性很高。

这个融资背后的原因一定是非常有趣的,相信也是大家很关心的,不过这背后的故事且让子弹飞一会儿,我们先看下这款产品当下的效果究竟如何吧。

Genspark 是什么

Genspark 是一个由百度前高管创立的人工智能搜索引擎。创始人经验丰富,对搜索的理解深刻,也不拘泥于做搜索的增强,而是要从内容和商业化角度重构搜索。

Genspark 最大的特点是通过 AI Agent 生成网页,称为 Sparkpages,这些网页整合了关于一个主题的所有相关内容,包括文字、图片、视频等,提供丰富的信息。这些内容的呈现形式,就是我们熟悉的瀑布流。

好的搜索离不开内容的构建,对于百度来说,内容构建是通过百度知道、百度百科等产品来提供的,这些内部产品占据了百度搜索30%以上的流量。对于小红书来说,内容构建是通过UGC提供的,小红书的搜索渗透在50%以上,内容平台和搜索做到最后一定是竞争对手。

总之,简单粗暴地理解

Genspark=AI搜索+AI小红书。

Genspark 的技术可能遇到的问题

通过 AI 来生成内容,这件事收益显著,不再需要人工来创建页面、也不再需要运营一个生态来驱动UGC。

但可能的问题也随之而来,包括内容的准确性、实时性,我们真的可以相信AI创建的网页吗?

从竞品的一些思路来看,这件事非常值得谨慎,前有豆包生成海量网页污染搜索引擎并下线,后有 Perplexity 的 Pages 非常缓慢地灰度,其考虑的点就是让人类能对AI生成的内容进行review后再发布以保障质量。

基本搜索测试

Genspark 的主要功能可以分为基本搜索、旅行搜索、商品搜索、图片搜索。

首先来看一下基本搜索能力,这里主要对标在之前的测试中表现都很好的 Perplexity。

基本搜索测试1:deepseek 新发布的模型是什么

这个query的难点在于,deepseek 新发布的 coder 模型,和上个月发布的 v2 模型之间的间隔非常短,并且两个模型一个文科生一个理科生,都是最新模型。

从结果可以看出,pplx 的理解完全正确,genspark 则没有得到 coder 模型的任何信息。

基本搜索测试2: genspark 和 perplexity 的估值分别是多少

这个query的难点在于,genspark 的估值信息非常的新,是2天内的实时内容,而pplx的估值信息是几个月前的内容,要同时拿到两个信息进行对比,非常考验AI搜索的能力。

从结果可以看出,pplx 这里直接识别错了关键词,把 genspark 当成了 Glean。

Genspark 对关键词的识别正确,但是只找到了 genspark 的估值。两者都有提升空间。

不过上面两个题其实还是有些难度的,大部分日常搜索没这么难,在实际测试几轮后,发现 Genspark 和 Perplexity 的搜索结果都还不错,可用性都较高。

不过基本搜索完全无法体现出 Sparkpages 的优势,让我们快速进入后面的新形态测试

旅行搜索测试

旅行方面的攻略内容,最好的地方就在小红书,所以本轮用 Genspark 对比小红书,看看从哪里可以更快更好地获取信息。

旅行搜索测试1:武汉2日游

小红书的搜索结果我们比较熟悉,上面是输入框,下面是UGC瀑布流。

Genspark 的搜索形式比较独特,上层是一个AI Chat,下面是Sparkpages瀑布流。

但是问题来了,AI Chat 里的内容确实是武汉,但Sparkpages里却是重庆、成都、东北,完全不符合预期。

难道是因为武汉太冷门?

除了这个大的问题,还有就是 AI Chat 这个结果也问题很多,黄鹤楼和户部巷玩2小时就结束了,后面直接快进到东湖散步,这一天的行程是不是有些过于松弛了。而且小红书应该不会给你推荐户部巷。

旅行搜索测试2:伦敦5日游

用这个结果测试,发现 Genspark 的问题依旧,AI Chat 里是伦敦,Sparkpages 里是张家界、草原、青岛。这似乎是还有严重的bug需要修改的样子。而 AI Chat 里的结果也是非常没有参考性。

旅行搜索真是让人一言难尽,让我们快进到有趣的商品搜索。

商品搜索测试

商品搜索的测试,以 amazon 作为对比,看看传统的电商网站和AI商品搜索哪个更好用。

商品搜索测试1: 不入耳耳机 openair earbuds

不入耳耳机是现在最流行的耳机品类,个人也购买了不下三款,在这个测试里,先用了一些很难的query,比如音质最好的不入耳,发现两个网站都搜不太到,于是改为简单的query进行测试。

从测试结果看,Amazon 给的结果页符合预期,推荐的几款产品都是不入耳的热门产品,对于普通用户来说,购买踩坑率很低。

而 Genspark 的结果页,直接放了入耳耳机在里面,可以说误导性非常强了。另外这个 Pros/Cons 的对比方式,似乎参考意义也并不是很大,只是个非常表面的形式。

商品搜索测试2:圣诞节礼物 gift for xmas







请到「今天看啥」查看全文