自然语言处理 | 美熙智能

Python编程

langchain结合云原生Milvus向量数据库问答实践指南

本文探索云原生向量数据库Milvus的安装和使用，使用Langchain和港大的Instruction-XL模型做本地数据的切分和转向量，为那些无法使用OpenAIEmbeddings、不想将数据外泄到境外的项目提供了一个示例。 Milvus架构和简…

JiangYuan

02/05/2024

00360

自然语言处理

语言模型中Tokenization方法分析

tokenize的目标是把输入的文本切分成一个个子串，便于embedding处理和后续模型的使用。本文总结了Tokenize流程、方法和特点，并使用Huggingface库和tiktoken库做了示例。 tokenizer工作流程大致工作流程： Normali…

JiangYuan

02/05/2024

01270

深度学习

自动信息抽取系统

本文包括用于文本识别的 OCR、用于信息提取的语言模型和 NER，以及用于特定数据模式匹配和填写表单的正则表达式/规则。 1. 文本数据提取格式：基于文本的 PDF、基于图像的 PDF、图像为了有效地从这些格式中提取文…

JiangYuan

23/03/2024

00980

深度学习

LangChain使用

Langchain是什么？ Langchain可以说是现阶段十分值得学习的一个AI架构，它标准的定义了我们在构建一个LLM应用开发时可能会用到的东西。比如说在之前写过的AI文章中介绍的prompt，就可以通过Langchain中的PromptTemp…

JiangYuan

21/03/2024

001240

深度学习

大模型的N种并行训练方法汇总

数据并行数据并行，就是将数据集分为N份，分别装载到N个GPU节点中，每个GPU节点持有一个完整的模型副本，分别基于每个GPU中的数据去进行梯度求导。在GPU0上对每个GPU中的梯度进行累加，最后，再将GPU0聚合后的结果…

JiangYuan

21/03/2024

001350

自然语言处理

盘点那些热门的开源AI Agent框架【持续更新...】

开源的AI Agent框架：加速智能应用开发的利器

JiangYuan

29/02/2024

001.2K0

自然语言处理

Instruction-tuning Llama2大模型文本分类微调示例

本文介绍通过微调 Meta 的 Llama 2 7B 模型对18 个不同类别的新闻文章进行分类，本教程将详细解释每个步骤，涵盖使用的所有类、函数和参数。安装所需库加载所需库 Bitsandbytes 配置定义一个函数&nbs…

meixi

30/08/2023

021.4K0

自然语言处理

LLM情感聊天机器人-数据获取方法简析

近期出现一些基于大模型的情感陪伴型对话机器人，主要是结合心理学知识，使用心理咨询数据训练，实现量表测量、情绪安抚、情感陪伴等功能，为老人、青少年等提供心理健康支持。本文选取了两个项目，分别用ChatGLM6B…

meixi

29/08/2023

00800

自然语言处理

大模型的N种高效部署方法：以LLama2为例

通过部署LLama2示例，比较不同LLM开源推理服务框架的优缺点。本文没介绍深度学习模型推理服务的传统库，如TorchServe，KServe或Triton Inference Server。 1. vLLM 它的吞吐量比HuggingFace Transformer （HF）高 …

JiangYuan

04/08/2023

022.2K0

自然语言处理

LLama2: 使用 FastAPI、Celery、Redis 和 Docker 构建可扩展的聊天机器人

本文介绍如何使用 Llama 2 和 FastAPI、Redis 和 Celery 构建基于大模型对话的应用程序，将介绍这些概念以及它们如何协同工作的。我们一直在使用 FastAPI 来构建我们的LLM应用，是一个用高性能 Web 框架，其异步功…

JiangYuan

30/07/2023

007860

自然语言处理

文本生成模型解码策略对比（13种）

目前常见的文本生成解码策略对比分析，涉及到Greedy Search、Beam Search、Top-K采样、Top-p（核）抽样、对比搜索解码策略、Multinomial sampling 多项抽样、Beam-search multinomial sampling、多样化波束搜索解码

JiangYuan

05/06/2023

038650

深度学习

Bloom论文阅读笔记，大模型是怎么训练的？

Bloom是一个开源可商用模型，它是如何一步步设计的？用了哪些数据和硬件资源?模型结构细节是怎样的？训练细节是怎样的？......

JiangYuan

27/05/2023

118970

深度学习

大模型加速微调和训练，不得不掌握的方法，代码解析和应用示例

LoRA模型加速原理、peft包使用、Autocust自动混合精度、Accelerate和deepspeed加速、多GPU分布式训练等大模型加速训练和微调的方法和代码模板

meixi

06/04/2023

022.7K1

深度学习

大模型微调之P-tuning方法解析

Prefix-Tuning、P-tuning V1和 V2相关的原理和思路，并结合了大模型ChatGLM微调解析。

meixi

06/04/2023

004.1K0

深度学习

如何搭建一个智能对话机器人？行业应用和问答技术梳理

智能对话机器人技术进展如何？存在哪些问题？如何设计一个企业对话机器人？用到哪些技术？

meixi

07/03/2023

006970