悲催的袜子
主页
关于
主页
Search Your Block Floating Point Scales!
2026年5月20日
拆解华为的快速整数除法
2026年5月17日
Efficiency, Expressivity, and Extensibility in a Close-to-Metal NPU Programming Interface
2026年5月14日
Tempus: A Temporally Scalable Resource-Invariant GEMM Streaming Framework for Versal AI Edge
2026年5月6日
Striking the Balance: GEMM Performance Optimization Across Generations of Ryzen™ AI NPUs
2026年5月4日
AutoPPA: Automated Circuit PPA Optimization via Contrastive Code-based Rule Library Learning
2026年4月28日
DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence
2026年4月24日
M100: An Orchestrated Dataflow Architecture Powering General AI Computing
2026年4月23日
MLIR: Scaling Compiler Infrastructure for Domain Specific Computation
2026年4月16日
ZipFloat: An Ultra-fast and Lossless Floating-Point Compressor for LLM Inference Systems
2026年3月30日
70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float (DFloat11)
2026年3月17日
CuTe Layout Representation and Algebra
2026年3月6日
Think Fast: A Tensor Streaming Processor (TSP)
2026年3月4日
Analyzing Modern NVIDIA GPU cores
2026年3月3日
深入理解 LLVM code generator (一)
2021年8月27日
为LLVM添加简易RISCV后端(五):算术指令
2020年12月11日
为LLVM添加简易RISCV后端(四):指令选择
2020年12月8日
为LLVM添加简易RISCV后端(三):配置构建系统
2020年12月8日
为LLVM添加简易RISCV后端(二):创建后端
2020年12月6日
为LLVM添加简易RISCV后端(一):入门
2020年12月4日
为LLVM添加简易RISCV后端(零):简介
2020年12月3日
TableGen 简介
2020年11月3日
编写LLVM后端
2020年11月1日
Write an LLVM Backend(零):简介
2020年11月1日
无匹配项