专栏名称: 硅星GenAI
比一部分人更先进入GenAI。
目录
相关文章推荐
Python爱好者社区  ·  英伟达憾失DeepSeek关键人才?美国放走 ... ·  昨天  
Python爱好者社区  ·  DeepSeek创始人梁文锋个人履历 ·  3 天前  
Python爱好者社区  ·  多模态,杀疯了 ·  2 天前  
Python开发者  ·  o3-mini 碾压 DeepSeek ... ·  5 天前  
Python开发者  ·  请立即拿下软考证书(政策风口) ·  4 天前  
51好读  ›  专栏  ›  硅星GenAI

零代码基础都敢去魔改MiniCPM-V了?是我飘了,也是 Cursor 太强了

硅星GenAI  · 公众号  · Python  · 2024-09-05 21:45

主要观点总结

文章介绍了作者对Python学习的看法和体验,以及对Cursor这款编程工具的使用感受。

关键观点总结

关键观点1: 文章提到很多人有学习Python的意愿,但遇到教程不符合需求的问题。

作者表示不是要用编程谋生,只是想解决工作上的具体问题,但很多教程过于泛泛而谈,没有针对性。

关键观点2: 介绍Cursor工具的使用体验。

作者通过下载Cursor并在官方项目中操作,进行汉化、设置规则、生成贪吃蛇游戏等实例,展示了Cursor的便捷性。作者认为Cursor震撼之处在于全程不需要切换网页搜索答案,只要提出要求,就能解决问题。

关键观点3: 作者利用Cursor开发实用程序。

作者举例开发了一个Chrome插件,可以下载网页中的图片并自动将.webp格式转换为.PNG格式。此外,作者还挑战了更高难度的项目,如魔改大模型等。

关键观点4: 作者对Python学习和Cursor的评价。

作者认为Cursor解决了学习Python的难题,如如何上手、前期部署环境等,让人上瘾。虽然Cursor有收费版本,但作者表示愿意为此付费。


正文

不知道有多少人曾经有想过要学一学 Python。

至少我书架上还躺着一本落灰的《Phthon 编程从入门到实践》,B 站的收藏夹里也放着从来没打开过的时长长达近  25 小时的《Python全套课程》视频。

不是真的坚持不下去学习,而是他们教的确实不是我想要的。 我也不是要用编程来谋生,就是想解决工作上一些具体到不能再具体的问题。但所有教程都在跟你说,你得先从 Hello World 学起。

Cursor 最近很火,在程序员圈子里讨论的很多,但对于大部分人来说,一款代码编辑器的更新和进展还是离大部分人的日常工作太远了。

如果这么想,那你大概率会错过一次进入新世界的机会。

我现在对于 Cursor 的痴迷程度,已经完全不亚于玩黑神话悟空了。

#01

一行代码没敲,先做一款游戏试试水

在官网( https://www.cursor.com/ )下载好程序后,默认是在一个 Cursor 的官方项目中。看不懂没关系,第一步我们先给汉化加上。

选中左上角的扩展,可以搜索 “简体” ,一般第一个就是我们要打的汉化包。

给界面汉化后,我们还可以通过在设置中,加入一些规则(可以来这里找: https://cursor.directory/ ),来让回答更加高效和结构化。如果加入“ZH-CN ONLY”,可以让他以中文来回答。在我玩的过程中,中英文回答的能力差距不是特别明显。我这里使用的是一个 Python 相关的规则。

之后通过文件-关闭文件夹,能关掉这个官方的演示项目,我们可以新建文件夹来做自己的了。

第一个项目,想先做一款 贪吃蛇游戏 ,通过command+K的快捷键调出“Chat”区域,给他 Prompt:“生成一款贪吃蛇游戏”。它会自动生成所有代码和文件,点击Accept All 所有生成效果即会生效。

它会自动生成文件,并告诉我们需要什么依赖环境和该怎么运行,最终的结果是这样:

一个非常简陋的贪吃蛇游戏就生成了。 还可以跟它说:“以程序方式展现游戏,蛇头应该比身体要大。”于是我们第一款贪吃蛇游戏,就从网页变成了程序,而且也更像蛇了:

用 Cursor 我能把我所有的想法,都实现,一行代码没敲过,比如我想让他变得更像蛇和苹果,背景也应该是绿色的草地:

如果让它变得更有趣,可以加入关卡机制 ,随着关卡的升高,速度会越来越快,也会出现炸弹的干扰项,吃到炸弹也会 Game Over,在最后也会引入排行榜机制,整个游戏已经非常完整了。

这里不管是苹果的样式还是炸弹的样式,没有用贴图,而是我是让它通过像素的方式画出来的。主打一个全程只动嘴不动手。

#02

开发一个真正有用的程序

玩到这里,我已经被 Cursor 震撼到了,全程不需要切换任何网页去搜索答案,只要我说出口的要求,他都能解决。 我要做的只是说说话,点一点,然后复制粘贴一些命令行就行了。

我就想能不能做一些真正对我有用的产品出来。

一个非常小的需求:现在下载图片,尤其是在 Google 图片中,很多通过右键下载的都是 .webp 的格式,这种格式的图片微信公众号后台并不支持。 那我能不能做一个 Chrome 插件来下载网页中的图片,同时遇到 .webp 的格式就自动转换成 .PNG 的格式。

于是第二个项目就成了。

比如在 GooglePlay 页面中,想要下载这个 Logo 的图片,右键保存是 .webp 格式的。

但是用我做的这个插件,可以直接下载成.PNG 的格式。

当然,每一个项目和程序,都几乎不可能一次成功,中间少不了需要调试的过程。目前为止,我的万能解药就是将报错直接复制,他会给我解释报错的原因和解决方法。点击左上角的按钮可以快速呼出 Chat 和终端。

#03

再做一点更疯狂的事

上面两个项目,总共耗时也就两三个小时,中间的版本功能迭代和调试环境比较费时。 模型全程使用的是 Claude 3.5 sonnet,也是默认设置。

我感觉我已经掌握了 Python 的运作和基本语法,是时候挑战一点更高难度的东西了。

那就魔改一个大模型吧。

我们都知道现在大部分模型都是靠英伟达的 CUDA 来运用,非英伟达的显卡没办法做加速运算。

从 Github 上转了一圈开源模型,发现趋势月榜上,面壁的 MiniCPM-V 还在前列,这款端侧模型正好合适来测一测能不能原生运行在我这个 M1 Pro 芯片的 Macbook 上。

解压后用 Cursor 打开,试运行了一下自带的 Web-Demo,发现像是gradio、torch、transformers 等一堆环境都没安装。

环境整齐,点击运行很快就会提示系统中没有 CUDA。

Cursor 给出的解决方案是用修改代码的方式来通过 CPU 启动。







请到「今天看啥」查看全文