
Categories
2024
实现本地 RAG 服务:整合 Open WebUI、Ollama 和 Qwen2.5

Arm 矩阵加速:可伸缩矩阵扩展 SME

Arm 性能优化:可伸缩向量扩展 SVE

LLM 生态介绍:从模型微调到应用落地

RDMA 之 Memory Window

RDMA 之 Shared Receive Queue

RDMA 之 Completion Queue

RDMA 之 Queue Pair

基于 Workbox 实现 Hugo 渐进式 Web 应用

Ollama:从入门到进阶

RDMA 之 Address Handle

Docker Hub 镜像下架解决方案

RDMA 之 Protection Domain

RDMA 之 Memory Region

记录:安装 Intel® OneAPI-2024.0

笔记:Pure - 改进消息传递以更好地利用节点内的共享内存

科研图表绘制

RDMA 基本服务类型

RDMA 操作类型

搭建玄铁 900 系列工具链与 xuantie-qemu 环境

OpenMP 简介

RDMA 基本元素

比较基于传统以太网与 RDMA 技术的通信

编译安装 UCX 1.15.0 与 OpenMPI 5.0.0:详尽指南

GCC-13.2.0 编译安装

RDMA 概述

2023
在 HPC 上运行 Apache Spark

使用 Pillow + Plugin 处理 AVIF 和 HEIC 图片

Ring buffer 详解

性能刺客之伪共享

离子通道与 Hudgkin-Huxley 模型

脉冲神经网络入门:神经元与数学

NEST on HPC 安装教程

CUDA 基础:内存访问模式

CUDA 基础:内存管理

CUDA 基础:内存模型概述

CUDA 基础:线程束执行的本质

SSE 与 AVE 向量化编程

程序调试与优化分析工具

高性能异步 I/O 框架:io_uring

RDMA 技术及其编程方法(二):编程指导

RDMA 技术及其编程方法(一):RDMA 简介与原理

MPI 与并行计算(五):MPI 扩展

MPI 与并行计算(四):数据类型

MPI 与并行计算(三):集合通信

MPI 与并行计算(二):点到点通信

MPI 与并行计算(一):并行环境及编程模型

最小反馈弧集合问题

SVD 与 NMF:矩阵分解的两种方法

CUDA 编程:从基础到应用

RDMA:Soft-RoCE 环境搭建实验
