专栏名称: 开源前线
推荐热门开源软件,播报最新开源项目和开源资讯!
目录
相关文章推荐
新闻广角  ·  马斯克:关闭美国之音 ·  23 小时前  
新闻广角  ·  多家车企官宣:接入DeepSeek ·  昨天  
新闻广角  ·  王濛怒斥韩国选手推搡林孝埈 ·  2 天前  
新闻广角  ·  墨西哥客车与货车相撞起火!至少30人遇难 ·  2 天前  
新闻广角  ·  哪吒2进入全球票房TOP50 唯一非好莱坞影片 ·  2 天前  
51好读  ›  专栏  ›  开源前线

一周涨了 15k 的 Star!炸裂开源!

开源前线  · 公众号  ·  · 2024-07-05 10:46

正文

来自公众号: 逛逛GitHub

一键将URL转换为LLM友好输入的工具

Reader是由Jina AI开发的一项创新开源工具,致力于改善大型语言模型(LLMs)的输入质量。 这个工具不仅免费、稳定,而且可扩展,是Jina AI核心产品之一。

开源地址:https://github.com/jina-ai/reader
它通过两个主要功能简化了信息的获取和处理:
1. URL转换: 通过在任何URL前添加 https://r.jina.ai/ ,Reader可以将网页内容转换为LLM友好的格式,自动为缺少 alt 标签的图片生成说明,并以特定格式呈现。
2. 网络搜索: 使用 https://s.jina.ai/ 前缀,Reader 能够搜索网络并返回最相关的五个结果,每个结果都以 LLM 友好的格式呈现。
举个例子
我在 GPT-4 的百度百科主页网址前添加 https://r.jina.ai/:
点击回车后,就会输出如下格式,该格式可以让 LLM 更好的提取信息:

2. 用C语言和CUDA训练大型语言模型

在深度学习领域,PyTorch和TensorFlow等框架几乎占据了主导地位。但如果你对底层原理充满好奇,或者想从头开始理解模型训练的每一个细节,那么 llm.c 项目绝对值得一探。
这个开源项目短短一周,就获得了 15k 的 Star!
llm.c 是一个用纯C和CUDA编写的大型语言模型(LLM)训练项目。它的核心目标是提供一个简单、清晰的实现(仅仅 1000 行代码),让用户能够在不需要庞大框架支持的情况下,训练和理解GPT-2模型。
这个项目不仅是对技术的一次挑战,也是对教育的贡献,因为它让用户能够深入到模型训练的每一个细节。
本项目以简洁、直观的方式,将复杂的深度学习模型训练过程用C语言呈现出来,让更多人能够接近并理解这一领域。






请到「今天看啥」查看全文