专栏名称: 机器学习算法与Python实战

长期跟踪关注统计学、数据挖掘、机器学习算法、深度学习、人工智能技术与行业发展动态，分享Python、机器学习等技术文章。回复机器学习有惊喜资料。

一行命令，本地、离线运行大模型

机器学习算法与Python实战 · 公众号 · · 2024-03-23 18:04

正文

Ollama简介

一句话概括：Ollama 是一个允许您在计算机上本地运行开源大语言模型（LLM）的工具

极简安装并运行大模型

安装客户端：https://ollama.com/download

下载后安装即可

然后就可以在Terminal中 一个命令 下载、运行大模型，比如最近大火的mistral，4G左右。

模型下载完成后就可以直接在Terminal中聊天了

我的电脑是丐版MacBook Air M1，推理时巨卡无比

Olamma支持大模型列表

https://ollama.com/library

Model	Parameters	Size	Download
Llama 2	7B	3.8GB	`ollama run llama2`
Mistral	7B	4.1GB	`ollama run mistral`
Dolphin Phi	2.7B	1.6GB	`ollama run dolphin-phi`
Phi-2	2.7B	1.7GB	`ollama run phi`
Neural Chat	7B	4.1GB	`ollama run neural-chat`
Starling	7B	4.1GB	`ollama run starling-lm`
Code Llama	7B	3.8GB	`ollama run codellama`
Llama 2 Uncensored	7B	3.8GB	`ollama run llama2-uncensored`
Llama 2 13B	13B	7.3GB	`ollama run llama2:13b`
Llama 2 70B	70B	39GB	`ollama run llama2:70b`
Orca Mini	3B	1.9GB	`ollama run orca-mini`
Vicuna	7B	3.8GB	`ollama run vicuna`
LLaVA	7B	4.5GB	`ollama run llava`
Gemma	2B	1.4GB	`ollama run gemma:2b`
Gemma	7B	4.8GB	`ollama run gemma:7b`

Gemma是由Google DeepMind构建的一系列轻量级、最先进的开放模型。

Llama 2是一系列基础语言模型，参数范围从7B到70B。

Mistral发布的7B模型，更新至版本0.2。

Mixtral是Mistral AI提供的一款高质量的专家混合（MoE）模型，开放权重。

LLaVA是一个全新的大型多模态模型，结合了视觉编码器和Vicuna，用于通用的视觉和语言理解。更新至版本1.6。

neural-chat是基于Mistral的经过微调的模型，覆盖了良好的领域和语言范围。

Codellama是一个可以使用文本提示生成和讨论代码的大型语言模型。

Dolphin-mixtral是基于Mixtral的专家混合模型的未经审查、经过微调的模型，在编码任务上表现出色。由Eric Hartford创建。

Mistral OpenOrca是一个7亿参数的模型，在Mistral 7B模型的基础上使用OpenOrca数据集进行了微调。

Orca-mini是一个通用模型，参数范围从30亿到70亿，适合入门级硬件。

Phi-2：由微软研究院开发的2.7B语言模型，展示了出色的推理和语言理解能力。

DeepSeek Coder是一个强大的编码模型，经过两万亿代码和自然语言标记的训练。

基于Mistral的未经审查的Dolphin模型，在编码任务上表现出色。更新至版本2.6。

Vicuna是基于Llama和Llama 2的通用聊天模型，上下文大小从2K到16K不等。

Wizard Vicuna Uncensored是一个基于Llama 2的未经审查的7B、13B和30B参数模型，由Eric Hartford创建。

Zephyr beta是Mistral的7B版本的微调版本，训练涵盖了公开可用的、合成的数据集混合。

OpenHermes 2.5是一个7B模型，由Teknium在Mistral的基础上使用完全开放的数据集进行了微调。

State-of-the-art的代码生成模型。

Qwen 1.5是阿里巴巴云提供的一系列大型语言模型，参数范围从0.5B到72B。

Llama 2基础上的模型，经过微调以提升中文对话能力。

基于Code Llama的代码生成模型。

TinyLlama项目是一个开放的尝试，旨在训练一个紧凑的1.1B Llama模型，使用了3万亿标记。

OpenChat是一系列在多种数据上训练的开源模型，超越了ChatGPT在各种基准测试上的表现。更新至版本3.5-0106。

Orca 2由微软研究院构建，是Meta的Llama 2模型的微调版本。该模型特别擅长推理。

Nous Research提供的基于Llama和Llama 2的通用使用模型。

由Eric Hartford创建的2.7B未经审查的Dolphin模型，基于微软研究院的Phi语言模型。

TinyDolphin是一个实验性的1.1B参数模型，基于Eric Hartford的新Dolphin 2.8数据集并基于TinyLlama训练。

Starling是一个通过AI反馈的强化学习训练的大型语言模型，专注于提高聊天机器人的帮助性。

基于Llama2的优秀代码生成模型。

StarCoder是一个在80多种编程语言上训练的代码生成模型。

微调的Llama 2模型，基于一个开源医疗数据集回答医疗问题。

BakLLaVA是一个多模态模型，由Mistral 7B基础模型与LLaVA架构增强而成。

未经审查的基于Llama2的模型，支持16K上下文窗口。

Stable Code 3B是一个模型，提供准确且响应迅速的代码完成，与如CodeLLaMA 7B这样体积是其2.5倍的模型相当。

Solar是一个紧凑但强大的10.7B大型语言模型，专为单轮对话设计。

基于Llama 2的模型，经过微调，适用于Orca风格的数据集。最初被称为Free Willy。

SQLCoder是一个在StarCoder的基础上针对SQL生成任务微调的代码完成模型。

Mistral的扩展，支持64K或128K的上下文窗口。

Nous Research的Nous Hermes 2模型，现在在Mixtral上进行训练。

Samantha-Mistral是一个在哲学、心理学和个人关系方面接受训练的伴侣助手。基于Mistral。

StableLM-Zephyr是一个轻量级聊天模型，允许在不需要高端硬件的情况下提供准确且响应迅速的输出。

Meditron是一个开源的医疗大型语言模型，从 Llama 2适应到医疗领域。

Wizard Vicuna是一个基于Llama 2的13B参数模型，由MelodysDreamj训练。

Magicoder是一个家族，包括7B参数模型，使用OSS-Instruct的75K合成指令数据训练，这是一种用开源代码片段启发LLM的新方法。

Stable LM 2 1.6B是一个最先进的1.6亿参数的小型语言模型，训练涵盖了英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据。

Llama 2的扩展，支持高达128k标记的上下文。

Nous Research提供的强大的模型家族，在科学讨论和编码任务上表现出色。

DeepSeek LLM是一个先进的语言模型，使用2万亿双语标记制作。

Llama 2的扩展，专门整合了通用语言理解和特定领域知识，特别是在编程和数学方面。

Open Orca OpenChat模型和Garage-bAInd Platypus 2模型的融合。设计用于聊天和代码生成。

Codebooga是通过合并两个现有代码模型创建的高性能代码指导模型。

Nexus Raven是一个为函数调用任务调优的13B指令模型。

MistralLite是基于Mistral的经过微调的模型，增强了处理长上下文的能力。

一行命令，本地、离线运行大模型

正文

Ollama简介

极简安装并运行大模型

Olamma支持大模型列表

请到「今天看啥」查看全文