分块注意力机制归档 - 小码的CheatSheet

金融时序预测革命：Transformer架构如何重构量化投资决策边界

Tim

0

107

2025-04-10

.NET, Transformer模型, 分块注意力机制, 时序预测, 金融AI

在金融市场的硝烟中，每个毫秒级的波动都暗藏万亿财富的密码。当传统量化模型在非线性金融时序数据的泥沼中艰难跋涉时，Transformer架构正以颠覆性的时空建模能力重塑投资决策范式。这场由注意力机制引发的技术革命，正在重构量化投资的底层逻辑。一、金融时序预测的技术困局传统时间序列模型（ARIMA、GA

突破百万token边界：解密Gemini 1.5如何重塑多模态理解天花板

Tim

0

67

2025-04-09

tech

.NET, 1.5, CV大模型, 分块注意力机制, 超长上下文处理

在人工智能领域，处理超长上下文始终是制约模型性能的关键瓶颈。当主流大模型还在为8k-32k token的上下文窗口苦苦优化时，Gemini...

揭秘vLLM框架：大模型推理吞吐量跃升10倍的核心技术解析

Tim

0

52

2025-04-08

tech

.NET, PagedAttention, vLLM框架, 分块注意力机制, 吞吐量提升

在生成式AI浪潮席卷全球的当下，大语言模型的推理效率已成为制约应用落地的关键瓶颈。传统推理框架在应对长文本生成、高并发请求等场景时，常面临显存利用率低、计算资源闲置、请求排队延迟三大痛点。本文将深入剖析vLLM框架通过三大创新技术体系——分块注意力机制、动态内存管理与智能调度算法，实现推理吞吐量数量