LangChain
-
大模型算法岗常见面试题100道
一、基础篇 1、目前主流的开源模型体系有哪些? 2、prefix LM 和 causal LM 区别是什么? prefix LM (前缀语言模型):在输入序列的开头添加一个可学习的任务相关的前缀,然后使用这个前缀 和输入序列一起生成输出。…
-
大模型的N种高效部署方法:以LLama2为例
通过部署LLama2示例,比较不同LLM开源推理服务框架的优缺点。本文没介绍深度学习模型推理服务的传统库,如TorchServe,KServe或Triton Inference Server。 1. vLLM 它的吞吐量比HuggingFace Transformer (HF) 高 …