专栏名称: 玉树芝兰
思考教育、写作和互联网。 我已委托“维权骑士”(rightknights.com)为我的文章进行维权行动。
目录
相关文章推荐
大数据分析和人工智能  ·  一款更适合小白的AI工具,强的可怕 ·  昨天  
CDA数据分析师  ·  Deepseek来袭,数据分析师会失业吗? ·  昨天  
大数据分析和人工智能  ·  35岁+被优化了!Deepseek给出了真相 ·  3 天前  
软件定义世界(SDX)  ·  【PPT】厦大团队:大模型概念、技术与应用实践 ·  3 天前  
天池大数据科研平台  ·  反超DeepSeek!新版GPT-4o登顶竞 ... ·  2 天前  
51好读  ›  专栏  ›  玉树芝兰

Windsurf Cascade 如何为你 AI 赋能,解决真实需求?

玉树芝兰  · 公众号  · 大数据  · 2024-12-04 19:24

主要观点总结

本文介绍了新工具Windsurf的发布和相关的优惠活动。文章通过实际例子展示了Windsurf Cascade的能力,包括利用Jina AI的API进行长文本分片,并解决分片过于稀疏的问题。文章还提到了使用Windsurf开发原型系统的过程,以及相关的挑战和解决方案。

关键观点总结

关键观点1: Windsurf发布及优惠活动

Windsurf是一个新发布的工具,最近推出了延长试用期优惠。官方宣布免费试用时间虽然相比原本两个月有所缩短,但仍给了用户充足的时间来体验该工具。

关键观点2: Windsurf Cascade的介绍与实例

Windsurf Cascade是一个具备强大推理能力的引擎,能够深度思考并进行多步骤操作。通过实例展示了其利用Jina AI的API进行长文本分片的能力,并解决了分片过于稀疏的问题。

关键观点3: 使用Windsurf开发原型系统的挑战与解决方案

在使用Windsurf开发原型系统时,可能会遇到诸如长文本分片的挑战。但通过合理的设置和策略,可以有效地解决这些问题。


正文

(注:本文为小报童精选文章。已订阅小报童或加入知识星球「玉树芝兰」用户 请勿重复付费

从今天开始,就把 AI 当成你的合作伙伴,一起创造吧!

新工具

Windsurf 发布有些日子了。前几天有个黑五优惠,我还在知识星球里喊了一声。

不过,兴许是羊毛被薅得太狠了,官方跑出来,宣布给大家一个试用期延长优惠,直到 12 月 11 号。

相比起原本的两个月,这个免费试用时间其实是大幅缩短的。咱那个 pro 账号 11 日之后究竟还能不能用,现在是个未知数。

很多小伙伴开始用 windsurf,总是感觉很兴奋。知识星球上,有星友用它开发了 Todoist 和 Obsidian 链接插件。

有的星友则更进一步,做了个智能 PDF 翻译应用出来。

看见别人玩儿得那么嗨,估计你也跃跃欲试。但是很多小伙伴还是没能掌握 Windsurf ,尤其是它特色的 Windsurf Cascade 的妙处。

如果你看各种介绍,会了解到一些定义。

例如 「Cascade 是一个强大的推理引擎,能够进行深度的多步骤思考,具备编辑和解释代码的能力」,再比如「Cascade 具备实时感知开发者行为的能力,能够基于持续的工作内容执行、调整和继续编辑任务」。

但这究竟是什么意思?

咱们今天,就用一个实际的例子,说明 Windsurf Cascade 上述能力。让你也能用它快速开发原型系统,满足自己的实际需求。

例子

这个例子从网上一个现成的 API 作为起点,根据咱们的需求进行调整,生成一个咱们自己的软件包,并且让全世界都可以下载安装。这还不算,咱们还要在本地弄一个 Web 界面来方便用户来使用。

听起来,是不是好难啊?

一点儿都不难。

首先 ,咱们先来看一看这个 API。

这个 API 来自于 Jina AI ,作用是可以帮你给长文本分片。

估计你还记得,我 那个 Python的AI工作流框架 中的一个重要功能是 长文本分片 。因为大语言模型有个上下文限制,超出这个窗口,就无法处理。在Openrouter的模型列表左侧,你可以清楚看见 Context Length 这一项。从 4K 到 1M ,跨度很大。

另外,即便你的模型可以支持很长的上下文窗口,如果你不限制分片长度,很有可能模型输出的时候会自作主张,帮你「精简」输出长度。对于长文写作和翻译来说,这是很糟糕的。因为很多细节会被忽略掉。

我之前在 Python 框架里面,用的是 Langchain 的 RecursiveCharacterTextSplitter 作为基础来操作。

当然了,你看到的这个解释,也是 Windsurf 分析了代码库之后自动给出的。

但是,我对 Langchain 的这种分片方式,并不满意。边缘处出现的 overlap ,总会带来意想不到的问题,例如标题甚至标题后的一句话,都出现两遍。如果不人工检查,很容易让这些纰漏出现在最终结果中。

那你说,咱们把 overlap 设置为 0,让两个分片之间,没有任何重叠,不就好了?







请到「今天看啥」查看全文