📊数据
22,267
164

nemo-curator

用于LLM训练的GPU加速数据整理。支持文本/图像/视频/音频。具有模糊去重(快16倍)、质量过滤(30多种启发式方法)、语义去重、PII脱敏、NSFW检测等功能。可在GPU间扩展使用RAPIDS。适用于准备高质量训练数据集、清理网络数据或对大型语料库进行去重。

#data-quality#data-management#etl#gpu#llm
分享
快速安装
>_npx skills add davila7/claude-code-templates
技术文档
正在加载文档...
仓库
仓库davila7/claude-code-templates
Star22,267
最后更新2026年3月7日
相关技能
19,500
1,516

supabase-postgres-best-practices

使用 Supabase 最佳实践优化 PostgreSQL 性能。

supabase
supabase/agent-skills
13,900
86,065

pdf

处理PDF文件,包括文本提取、合并、拆分和表单填写。

anthropics
anthropics/skills
10,600
86,065

xlsx

处理Excel等表格文件的读取、编辑和转换。

anthropics
anthropics/skills
8,100
11,519

analytics-tracking

设置、改进或审计分析跟踪和测量。

coreyhaines31
coreyhaines31/marketingskills
7,308
26

pattern-detection

检测代码和数据中的模式、异常和趋势。

supercent-io
supercent-io/skills-template