👋
Welcome
to
Cuterwrite 's
Blog
本文转载于知乎专栏:4. RDMA 操作类型,作者:Savir。RDMA 中有多种通信模型/模式,根据数据收发时 CPU 的参与情况,它们可以分为需要收发两端参与的双端操作和只需要发起方参与的单端操作。本文介绍了不同操作类型时数据在软硬件中的传递过程。
随着国产 RISC-V 芯片技术的快速发展,阿里巴巴平头哥的玄铁 900 系列处理器因其高性能、低功耗的特点备受瞩目。为了更好地支持基于玄铁 900 系列芯片的开发和调试工作,搭建一套完整的工具链和仿真环境至关重要。本文将详细介绍如何搭建玄铁 900 系列工具链及 xuantie-qemu 环境。
OpenMP(Open Multi-Processing)是一种广泛应用的多线程并行编程模型,它为共享内存系统上的并行计算提供了丰富的指令集和 API。起源于 1997 年,OpenMP 由多个领先硬件和软件供应商共同制定标准,旨在简化并行程序的设计与实现过程,以充分利用现代多核处理器的计算能力。本文将介绍 OpenMP 的基础知识和编程技巧。
本文转载于知乎专栏:3. RDMA 基本元素,作者:Savir。讲到 RDMA 协议,就绕不开各种各样的缩写。区别于 IB 协议原文,本文对 RDMA 中最重要的各种队列的概念作了简单和通俗的介绍,方便读者理解。
本文转载于知乎专栏:2. 比较基于传统以太网与 RDMA 技术的通信,作者:Savir。传统以太网通过对上层应用提供了 Socket 接口作为 API,而 RDMA 协议栈则向上层提供了 verbs 接口。以上两种通信方式在数据从本端用户的内存空间到达对端用户的内存空间这一过程中存在显著的差异。本文想通过对比这些差异告诉读者,为何我们要使用 RDMA 技术。
Unified Communication X (UCX) 和 Open Message Passing Interface (OpenMPI) 是高性能计算领域中不可或缺的两个组件。UCX 提供了一套高效的底层通信库,优化了硬件资源利用,而 OpenMPI 则是广泛应用于并行计算任务的消息传递接口。本文将详细指导如何从源代码编译安装 UCX 1.15.0 版本以及与其兼容的 OpenMPI 5.0.0 版本。
GCC-13 是一个重大更新,在这个版本,GCC 的静态分析器继续改进,有更多的 C23 和 C++23 功能,并支持许多新的 x86_64/RISC-V/AArch64 处理器。为了普及使用 C++ 新标准而不是一直写 C++17 甚至 C++11,我决定编译安装 GCC-13.2.0,体验一下新的 C++ 标准。
本文转载于知乎专栏:1. RDMA 概述,作者:Savir。本想完全靠自己的语言完成这篇概述,然而开篇并没有想象当中的好写,看样子从宏观上概括一个技术比从微观上探究细枝末节要困难不少。本文是以前人们对 RDMA 技术的介绍为主,加入了一些自己的理解。随着本专栏内容的增加,本篇概述也会更新和逐渐完善。
Apache Spark 是一个多语言引擎,用于在单节点机器或集群上执行数据工程、数据科学和机器学习任务。本文将为您提供在高性能计算(HPC)集群系统上运行多节点 Spark 集群的指南,并展示一个使用 PySpark 的作业示例。
在写博客的时候遇到了 AVIF 和 HEIC 图片格式,这两种图片格式都是基于 HEIF 的,但是考虑到兼容性,目前还是使用 JPEG 格式的图片比较多,所以这里记录一下如何使用 Pillow-AVIF-Plugin 和 Pillow-HEIC 处理 AVIF 和 HEIC 图片。本文将介绍如何使用 Pillow-AVIF-Plugin 和 Pillow-HEIC 库处理 AVIF 和 HEIC 图片,然后详细介绍安装过程、使用方法