meixi

meixi管理

这个人很懒,什么都没有留下~
60 posts
1 comments
2 followers
  • 2025 LeetCode Data Structures and Algorithms

    算法和开发面试的时候,一般会给一到两个编程题目。Leecode上面对 3,000 多个问题,很容易感到不知所措和迷失。 如何刷题? 了解基础知识 算法复杂性 基本数据结构,如数组、字符串、链表、堆栈、队列、哈希表和二…

    10/06/2025
    0270
  • 持续集成和部署 (CI/CD)和测试

    CI/CD 持续集成 (CI) 和持续部署 (CD) 是自动构建、测试和部署代码更改的流程。CI 是在代码更改提交到代码存储库后立即自动生成和测试代码更改的过程。CD 是在代码更改通过 CI 测试后自动将代码更改部署到生产…

    10/06/2025
    0400
  • functools高级编程技巧,Python代码优雅神器

    partial() 从概念上讲, partial是一种通过将部分参数应用于现有函数来创建新函数的便捷方法 。functools.partial 允许你创建一个新函数,该函数是现有函数的修改版本。你可以为一个或多个参数指定默认值,这意味着…

    10/06/2025
    0330
  • Pandas平替Polars

    Polars是一个用于操作结构化数据的高性能DataFrame库,可以说是平替pandas最有潜质的包。Polars其核心部分是用Rust编写的,但该库也提供了Python接口。主要特点包括: User guide: https://pola-rs.github.io/polar…

    30/05/2025
    0980
  • 大模型算法工程师面试问题汇总

    一、基础理论与数学 二、大模型架构与关键技术 三、训练与优化 四、推理与部署 五、大模型应用与评估 六、前沿与扩展 七、编程与工程 八、系统设计题常见考点 九、行为与行业认知 十、高阶问题 建议准备策略: 可重…

    默认分类 27/05/2025
    01350
  • Attention Please! MLA、MHA、MQA与GQA原理与代码实现

    多头注意力机制(Multi-Head Attention,MHA) 多头注意力(Multi-Head Attention, MHA)是Transformer模型的核心机制,通过并行计算多个注意力头,使模型能够同时关注输入序列中不同位置的特征。其核心思想是将输…

    20/05/2025
    02290
  • Faiss 索引选择和构建

    # Faiss 索引方法概览 Faiss 索引方法主要分为两大类: ### 精确索引 (Exact Index) : 这类索引方法会遍历所有向量,保证返回最精确的近邻结果。IndexFlatIP 和 IndexFlatL2 就属于精确索引。虽然结果精确,但当数…

    06/05/2025
    03120
  • HF datasets 使用技巧总结

    1. 常用操作:**Sort, shuffle, select, split, shard, rename, remove, cast, and flatten** 2. 结合 map 处理数据3. 不同格式的加载和存储4. 多线程加速处理5. 与pytorch操作示例 # 常用操作 ## 加载 ```python w…

    26/02/2025
    05650
  • DeepSeek超全指南【本地部署、构建知识库、指令技巧、热门客户端】

    Deepseek本地部署方法和构建个人知识库,指令技巧,配合客户端和插件使用。在 Word和WPS中又如何调用Deepseek服务?

    11/02/2025
    018.4K0
  • DeepSeek-R1是怎样炼成的?

    DeepSeek-R1反响非常大,主要是因为使用较低的成本得到了OpenAI O1的效果。开源还便宜。 在这篇文章中,我们将了解它是如何构建的。 目录: DeepSeek-R1 的训练方法 1. 大规模推理导向强化学习 (R1-Zero) 2. R1 …

    28/01/2025
    01.6K0
  • Agents

    Table of Contents 目录 Agent Overview 代理概述 Tools 工具 Knowledge augmentation 知识增强 Capability extension 能力扩展 Write actions 写入操作 Planning 规划 Planning overview 规划概述 Foundation mode…

    20/01/2025
    06730
  • free cursor

    问题: Too many free trial accounts used on this machine. Please upgrade to pro. We have this limit in place to prevent abuse. Please let us know if you believe this is a mistake. 一键式解决方案 url …

    13/01/2025
    01.0K0
  • SGLang, Ollama, VLLM, LLaMA.cpp推理框架对比

    这篇文章对 SGLang、Ollama、VLLM 和 LLaMA.cpp 四款大模型工具进行了多维度的对比,包括性能、易用性和适用场景等方面。 SGLang 的性能卓越,使其特别适合企业级应用。 Ollama 的安装便捷性使其非常适合个人轻量级…

    08/01/2025
    015.9K0
  • VS Code 调试

    launch.json创建:可以点击菜单栏:运行->添加配置 生成 { "version": "0.2.0", "configurations": [ { "name": "train_ds_zero2", "type": &quot…

    26/12/2024
    04460
  • ollama run Model on Hugging Face Hub

    之前写了篇比较全的ollama使用文档:https://www.icnma.com/ollama-tutorial/ 本篇主要是如何使用ollama直接运行huggingface上的gguf模型。 直接使用Ollama在Hugging Face上任何GGUF quant model,而无需创建新的Mo…

    25/11/2024
    01.5K0
Load more posts