全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
OpenAI Blog ★★★★☆ 2021-08-10

OpenAI Codex

推荐理由:涉及AI编程核心模型更新,与AI辅助编程直接相关

OpenAI发布了改进版Codex,该AI系统可将自然语言转为代码,并通过API开启私测。

Hugging Face Blog ★★★★☆ 2021-07-15

互联网上的深度学习:协作训练语言模型

推荐理由:涉及大模型训练新方法,具技术前瞻性和应用潜力

论文提出一种在互联网上协作训练语言模型的新范式,允许多方在不共享原始数据的前提下联合训练模型,兼顾隐私与模型性能。

Hugging Face Blog ★★★★☆ 2021-07-13

Welcome spaCy to the Hugging Face Hub

推荐理由:热门NLP工具库spaCy与Hugging Face集成,提升AI开发者效率

spaCy正式入驻Hugging Face Hub,用户可直接在Hub上访问其预训练模型、配置文件和词汇表,并通过spacy-huggingface-hub插件一键加载模型。

Lilian Weng's Blog ★★★★☆ 2021-07-11

What are Diffusion Models?

推荐理由:系统性介绍AI生成模型核心技术,对理解AIGC底层原理有重要价值

文章深入讲解扩散模型的原理、发展及关键技术,涵盖score-based生成建模、classifier-free guidance、latent diffusion等重要进展,并介绍GLIDE、Imagen、LDM等代表性模型。

Hugging Face Blog ★★★★☆ 2021-07-08

使用 Amazon SageMaker 轻松部署 Hugging Face 模型

推荐理由:实用的 AI 模型部署教程,结合主流平台与开源模型库

本文介绍如何利用 Amazon SageMaker 快速部署 Hugging Face 的 AI 模型,涵盖从模型选择、环境配置到推理服务上线的完整流程,并提供最佳实践和性能优化建议。

OpenAI Blog ★★★★☆ 2021-07-07

Evaluating large language models trained on code

推荐理由:聚焦代码大模型评测,契合AI vibe coding与模型评测主题

论文《Evaluating large language models trained on code》提出CodeXGLUE基准,系统评估代码大模型在代码生成、翻译、修复等任务上的性能,涵盖多个数据集和指标,为AI编程模型提供标准化评测框架。

Hugging Face Blog ★★★★☆ 2021-06-28

Sentence Transformers in the Hugging Face Hub

推荐理由:热门AI工具库推荐,实用性强

介绍 Hugging Face Hub 上的 Sentence Transformers 库,涵盖其文本嵌入模型的使用、微调及在语义搜索、聚类等任务中的应用。

Lilian Weng's Blog ★★★☆☆ 2021-05-31

Contrastive Representation Learning

推荐理由:介绍AI基础技术,对理解自监督学习有帮助

对比表示学习旨在构建嵌入空间,使相似样本靠近、不相似样本远离,广泛应用于视觉与语言任务的自监督学习中。

Hugging Face Blog ★★★☆☆ 2021-04-20

Scaling-up BERT Inference on CPU (Part 1)

推荐理由:涉及AI模型部署优化,对实际应用有参考价值

本文探讨在CPU上高效部署和扩展BERT模型推理的方法,涵盖优化策略与性能调优技巧。

Hugging Face Blog ★★★★☆ 2021-04-16

介绍 🤗 Accelerate

推荐理由:推荐热门AI工具库,提升训练效率

🤗 Accelerate 是 Hugging Face 推出的开源库,简化多GPU/TPU训练流程,让开发者无需修改代码即可高效扩展模型训练,支持FP8、分布式推理等前沿功能。

Hugging Face Blog ★★★★☆ 2021-03-31

理解 BigBird 的块稀疏注意力机制

推荐理由:涉及大模型核心技术细节,对理解高效注意力机制有参考价值。

文章深入解析 BigBird 模型采用的块稀疏注意力机制,如何在保持性能的同时降低计算复杂度,适用于长序列建模。

OpenAI Blog ★★★★☆ 2021-03-25

GPT-3 powers the next generation of apps

推荐理由:体现GPT-3在真实应用中的商业化落地案例

超过300款应用通过API集成GPT-3,实现搜索、对话、文本补全等AI功能,展示其在实际产品中的广泛应用。

Hugging Face Blog ★★★★☆ 2021-03-23

合作:Amazon SageMaker 与 Hugging Face

推荐理由:涉及主流 AI 模型服务与云平台集成,实用性强

Amazon SageMaker 与 Hugging Face 深化集成,用户可在 SageMaker 上更便捷地训练、部署 Hugging Face 的开源大模型,简化 AI 模型开发流程。

Lilian Weng's Blog ★★★★☆ 2021-03-21

Reducing Toxicity in Language Models

推荐理由:涉及AI模型安全与优化,属于模型评测与改进范畴

文章探讨降低语言模型毒性的三种方法:训练数据收集、毒性内容检测和模型去毒,旨在提升AI模型在现实应用中的安全性。

← 上一页 79 / 90 下一页 →