👋
Welcome
to
Cuterwrite 's
Blog
Pure 是一种新的编程模型和运行时系统,旨在在基于消息传递接口(增强使用任务利用空闲核心能力)的环境中充分利用节点内部的共享内存。Pure 通过两种方式利用共享内存:(1) 允许 rank 在等待消息到达时从彼此那里窃取工作;(2) 利用高效无锁的数据结构实现节点内各进程间高性能的消息传递和集合操作。研究者通过 micro benchmark 测试评估了 Pure 的关键消息传递和集合特性,并展示了在 CoMD 分子动力学和 miniAMR 自适应网格细化应用中,当扩展到 4096 个 rank 时,Pure 可实现高达 2.1x 的应用加速。
在科学研究中,精确而富有表现力的数据可视化是至关重要的一步。本文旨在探讨和推荐一系列专业且广泛应用的科研图表绘制工具,这些工具凭借其强大的功能和灵活性,成为科研人员不可或缺的工作伙伴。
本文转载于知乎专栏:5. RDMA 基本服务类型,作者:Savir。就像 TCP/IP 协议栈传输层的 UDP 和 TCP 一样,RDMA 技术也规定了在不同场景下的服务类型,不同的服务类型在可靠性和速率上各有侧重。本文介绍了 4 种主要服务类型的特点和应用场景。
本文转载于知乎专栏:4. RDMA 操作类型,作者:Savir。RDMA 中有多种通信模型/模式,根据数据收发时 CPU 的参与情况,它们可以分为需要收发两端参与的双端操作和只需要发起方参与的单端操作。本文介绍了不同操作类型时数据在软硬件中的传递过程。
随着国产 RISC-V 芯片技术的快速发展,阿里巴巴平头哥的玄铁 900 系列处理器因其高性能、低功耗的特点备受瞩目。为了更好地支持基于玄铁 900 系列芯片的开发和调试工作,搭建一套完整的工具链和仿真环境至关重要。本文将详细介绍如何搭建玄铁 900 系列工具链及 xuantie-qemu 环境。