👋
Welcome
to
Cuterwrite 's
Blog
随着国产 RISC-V 芯片技术的快速发展,阿里巴巴平头哥的玄铁 900 系列处理器因其高性能、低功耗的特点备受瞩目。为了更好地支持基于玄铁 900 系列芯片的开发和调试工作,搭建一套完整的工具链和仿真环境至关重要。本文将详细介绍如何搭建玄铁 900 系列工具链及 xuantie-qemu 环境。
OpenMP(Open Multi-Processing)是一种广泛应用的多线程并行编程模型,它为共享内存系统上的并行计算提供了丰富的指令集和 API。起源于 1997 年,OpenMP 由多个领先硬件和软件供应商共同制定标准,旨在简化并行程序的设计与实现过程,以充分利用现代多核处理器的计算能力。本文将介绍 OpenMP 的基础知识和编程技巧。
本文转载于知乎专栏:3. RDMA 基本元素,作者:Savir。讲到 RDMA 协议,就绕不开各种各样的缩写。区别于 IB 协议原文,本文对 RDMA 中最重要的各种队列的概念作了简单和通俗的介绍,方便读者理解。
本文转载于知乎专栏:2. 比较基于传统以太网与 RDMA 技术的通信,作者:Savir。传统以太网通过对上层应用提供了 Socket 接口作为 API,而 RDMA 协议栈则向上层提供了 verbs 接口。以上两种通信方式在数据从本端用户的内存空间到达对端用户的内存空间这一过程中存在显著的差异。本文想通过对比这些差异告诉读者,为何我们要使用 RDMA 技术。
Unified Communication X (UCX) 和 Open Message Passing Interface (OpenMPI) 是高性能计算领域中不可或缺的两个组件。UCX 提供了一套高效的底层通信库,优化了硬件资源利用,而 OpenMPI 则是广泛应用于并行计算任务的消息传递接口。本文将详细指导如何从源代码编译安装 UCX 1.15.0 版本以及与其兼容的 OpenMPI 5.0.0 版本。