ollama run Model on Hugging Face Hub

之前写了篇比较全的ollama使用文档:
https://www.icnma.com/ollama-tutorial/

本篇主要是如何使用ollama直接运行huggingface上的gguf模型。

file

直接使用Ollama在Hugging Face上任何GGUF quant model,而无需创建新的Modelfile。

https://huggingface.co/settings/local-apps 启用ollama

file

在模型页面上,从使用此模型中选择ollama。
file
file

ollama run hf.co/{username}/{repository}

# 例如
ollama run hf.co/bartowski/Llama-3.2-1B-Instruct-GGUF

# 加量化tag
ollama run hf.co/{username}/{repository}:{quantization}
# 例如
ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF:Q8_0

默认情况下,将从常用模板列表中自动选择模板。将根据GGUF文件中存储的内置tokenizer.chat_template元数据进行选择。如果想自定义聊天模板,可以在存储库中创建一个名为template的新文件,必须是Go模板,而不是Jinja模板。
例如:

{{ if .System }}<|system|>
{{ .System }}<|end|>
{{ end }}{{ if .Prompt }}<|user|>
{{ .Prompt }}<|end|>
{{ end }}<|assistant|>
{{ .Response }}<|end|>

模板格式:
https://github.com/ollama/ollama/blob/main/docs/template.md
要更改采样参数,请在存储库中创建一个名为params的文件。文件必须是JSON格式.
参考:
https://github.com/ollama/ollama/blob/main/docs/modelfile.md#parameter

原创文章。转载请注明: 作者:meixi 网址: https://www.icnma.com
Like (0)
meixi管理
Previous 20/10/2024 21:08
Next 08/01/2025 14:56

猜你想看

  • 均方层归一化RMSNorm(均方根标准化)

    一、理论基础 layer normalization 重要的两个部分是平移不变性和缩放不变性。 Root Mean Square Layer Normalization 认为 layer normalization 取得成功重要的是缩放不变性,而不是平移不变性。因此,去除了计算…

    24/05/2025
    02.8K0
  • 11步骤,使用大语言模型构建知识图谱

    大数据本身蕴藏着丰富价值,但从中挖掘洞见需要耗费大量人力。而知识图谱能够简化这一过程,通过将零散信息整合成结构化、可搜索的形式,能显著提高效率。一项研究表明,使用知识图谱可将数据探索时间最高缩短 70%…

    21/05/2025
    01.9K0
  • DeepSeek-R1是怎样炼成的?

    DeepSeek-R1反响非常大,主要是因为使用较低的成本得到了OpenAI O1的效果。开源还便宜。 在这篇文章中,我们将了解它是如何构建的。 目录: DeepSeek-R1 的训练方法 1. 大规模推理导向强化学习 (R1-Zero) 2. R1 …

    28/01/2025
    04.7K0
  • 大模型算法岗常见面试题100道

    一、基础篇 1、目前主流的开源模型体系有哪些? 2、prefix LM 和 causal LM 区别是什么? prefix LM (前缀语言模型):在输入序列的开头添加一个可学习的任务相关的前缀,然后使用这个前缀 和输入序列一起生成输出。…

    09/07/2025
    01.9K0
  • Embedding模型微调:基于已有数据快速构建训练与评估数据集

    ? 本文目标 本文主要面向希望在特定领域或任务中提升Embedding模型表现的初学者。希望读完之后,能帮助大家: 准确理解Embedding模型微调的核心概念及其对数据集的依赖。 初步掌握基于已有数据构建高质量微调训练集…

    21/05/2025
    02.1K0