🤖AI & 大模型
22,267
156

speculative-decoding

使用推测解码、Medusa多头和前瞻解码技术加速LLM推理。适用于优化推理速度(1.5-3.6倍加速)、降低实时应用延迟或在计算资源有限的情况下部署模型。涵盖草稿模型、基于树的注意力机制、Jacobi迭代、并行令牌生成和生产部署策略。

#llm-optimization#performance#deployment#llm#vllm#medusa
分享
快速安装
>_npx skills add davila7/claude-code-templates
技术文档
正在加载文档...
仓库
仓库davila7/claude-code-templates
Star22,267
最后更新2026年3月7日
相关技能
271,400
6,331

find-skills

帮助用户根据查询发现和安装代理技能。

vercel-labs
vercel-labs/skills
46,800
19,561

agent-browser

AI代理浏览器自动化CLI工具。

vercel-labs
vercel-labs/agent-browser
34,600
79,803

browser-use

自动化浏览器交互,用于网页测试、表单填写、截图和数据提取。

browser-use
browser-use/browser-use
32,600
86,065

skill-creator

创建有效AI技能的指南,扩展Claude的能力。

anthropics
anthropics/skills
24,400
55,506

brainstorming

用于在创意工作前探索用户意图和需求的头脑风暴技能。

obra
obra/superpowers