ollama run Model on Hugging Face Hub

meixi • 25/11/2024 13:03 • 人工智能, 大模型LLM • 2148 views

之前写了篇比较全的ollama使用文档：
https://www.icnma.com/ollama-tutorial/

本篇主要是如何使用ollama直接运行huggingface上的gguf模型。

直接使用Ollama在Hugging Face上任何GGUF quant model，而无需创建新的Modelfile。

在 https://huggingface.co/settings/local-apps 启用ollama

在模型页面上，从使用此模型中选择ollama。

ollama run hf.co/{username}/{repository}

# 例如
ollama run hf.co/bartowski/Llama-3.2-1B-Instruct-GGUF

# 加量化tag
ollama run hf.co/{username}/{repository}:{quantization}
# 例如
ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF:Q8_0

默认情况下，将从常用模板列表中自动选择模板。将根据GGUF文件中存储的内置tokenizer.chat_template元数据进行选择。如果想自定义聊天模板，可以在存储库中创建一个名为template的新文件，必须是Go模板，而不是Jinja模板。
例如：

{{ if .System }}<|system|>
{{ .System }}<|end|>
{{ end }}{{ if .Prompt }}<|user|>
{{ .Prompt }}<|end|>
{{ end }}<|assistant|>
{{ .Response }}<|end|>

模板格式：
https://github.com/ollama/ollama/blob/main/docs/template.md
要更改采样参数，请在存储库中创建一个名为params的文件。文件必须是JSON格式.
参考：
https://github.com/ollama/ollama/blob/main/docs/modelfile.md#parameter

原创文章。转载请注明：作者:meixi 网址: https://www.icnma.com

Like (0)

meixi管理

0 0

文本生成模型解码策略和采样方法对比分析（13种）

Previous 20/10/2024 21:08

SGLang, Ollama, VLLM, LLaMA.cpp推理框架对比

Next 08/01/2025 14:56

人工智能

用 LLM 将非结构化文本转为知识图谱

核心内容：1. 构建知识图谱的挑战与LLM的解决方案2. 环境配置与关键Python库的安装使用3. 知识图谱的基本概念及其在项目中的应用实例从非结构化文本中构建知识图谱是一项具有挑战性的任务。它通常需要识别关键术语…

JiangYuan
21/05/2025
008480
人工智能

Attention Please! MLA、MHA、MQA与GQA原理与代码实现

多头注意力机制（Multi-Head Attention，MHA）多头注意力（Multi-Head Attention, MHA）是Transformer模型的核心机制，通过并行计算多个注意力头，使模型能够同时关注输入序列中不同位置的特征。其核心思想是将输…

meixi
20/05/2025
001.6K0
人工智能

Attention：MLA、MHA、MQA与GQA

多头注意力机制（Multi-Head Attention，MHA）多头注意力（Multi-Head Attention, MHA）是Transformer模型的核心机制，通过并行计算多个注意力头，使模型能够同时关注输入序列中不同位置的特征。其核心思想是将输…

meixi
17/06/2025
006320
人工智能

11步骤，使用大语言模型构建知识图谱

大数据本身蕴藏着丰富价值，但从中挖掘洞见需要耗费大量人力。而知识图谱能够简化这一过程，通过将零散信息整合成结构化、可搜索的形式，能显著提高效率。一项研究表明，使用知识图谱可将数据探索时间最高缩短 70%…

JiangYuan
21/05/2025
001.0K0
【DeepSpeed】3D 并行原理解读

DeepSpeed 的 3D 并行是一种高级分布式训练策略，通过结合数据并行 (Data Parallelism, DP)、模型并行 (Model Parallelism, MP) 和流水线并行 (Pipeline Parallelism, PP)，在多 GPU 和多节点环境中高效训练超大…

JiangYuan
人工智能 21/05/2025
001.0K0

动化任务的数据处理和建模框架，机器人流程自动化（RPA）解决方案
20/01/2025 16:48
Share to:

SAYN 是一个现代数据处理和建模框架。用户定义任务（包括 Python、自动 SQL 转换等）及其关系，SAYN 负责其余工作。它旨在实现简单性、灵活性和集中化，以便为数据工程工作流程带来显著的效率提升。

有许多优秀的工具和公司助力工作流程自动化的发展：

1. Workflow Max：Workflow Max 是一款专注于工作流程自动化的小型企业管理系统，涵盖项目管理、财务核算、客户管理等业务。
2. Automation Anywhere：Automation Anywhere 是一款智能自动化平台，提供机器人流程自动化（RPA）解决方案，广泛应用于各种行业。
3. UiPath：UiPath 是一款 RPA 平台，为企业提供自动化解决方案，涵盖业务流程、桌面应用、Web 应用等。
4. Blue Prism：Blue Prism 是一款 RPA 平台，支持企业级自动化流程，具有高度可扩展性和安全性。 [Read More]
TorchLeet：PyTorch的练习题库
20/01/2025 16:45
Share to:

PyTorch的练习题库，就像编程界的“题海战术”，通过各种难度的实践题目，帮助你从新手到高手，掌握深度学习和PyTorch的精髓。 [Read More]
OpenFlux新版本！8B的Flex.1 alpha发布了
20/01/2025 16:44
Share to:

微调配置：
https://github.com/ostris/ai-toolkit/blob/main/config/examples/train_lora_flex_24gb.yaml [Read More]
RPA 自动化机器人 Robot Framework
19/10/2024 10:26
Share to:

Robot Framework 是一个通用的开源自动化框架，用于验收测试、验收测试驱动开发 (ATDD) 和机器人流程自动化 (RPA)。它具有简单的纯文本语法，并且可以使用通用和自定义库轻松扩展。
安装起来也简单。只要你的机器上装了Python和pip，直接在命令行里输入以下命令即可：

```
pip install robotframework
```
操作手册：
https://robotframework.org/robotframework/latest/RobotFrameworkUserGuide.html
llama-agent 让每个 agent 都是一个独立运行的微服务。
30/06/2024 20:04
Share to:

用户可以自由定制它们的功能和交互方式,还可以灵活部署、监控和扩展。无需再为分布式架构烦恼,只需专注于你的应用逻辑。