Manuel Ernesto ⚡️
Hotel's Blog 🏠
我是
Hotel
,欢迎来到我的个人博客😊。
这里将分享我在
AI
和
CS
领域的技术文档,以及个人经历和思考的随笔记录。
Recent blogs ✒️
LLM推理加速 Lesson2:FlashAttention
从I/O视角优化Transformer的基础模块Attention。
LLM推理加速 Lesson3:FlashInfer
从I/O视角优化Transformer的基础模块Attention。
LLM推理加速 Lesson 1:Roofline模型
描述算力和带宽对模型速度的影响,一切的基础。