笑笑乐园 - 朝花夕拾

OpenAI Blog ★★★★☆ 2021-08-10

OpenAI Codex

推荐理由：涉及AI编程核心模型更新，与AI辅助编程直接相关

OpenAI发布了改进版Codex，该AI系统可将自然语言转为代码，并通过API开启私测。

阅读原文 →

OpenAI Blog ★★★★☆ 2021-07-28

Introducing Triton: Open-source GPU programming for neural networks

推荐理由：热门AI工具库推荐，提升神经网络开发效率

Triton 1.0发布，这是一个开源的类Python GPU编程语言，让无CUDA经验的研究者也能编写高效GPU代码，性能媲美专家手写代码。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-07-15

互联网上的深度学习：协作训练语言模型

推荐理由：涉及大模型训练新方法，具技术前瞻性和应用潜力

论文提出一种在互联网上协作训练语言模型的新范式，允许多方在不共享原始数据的前提下联合训练模型，兼顾隐私与模型性能。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-07-13

Welcome spaCy to the Hugging Face Hub

推荐理由：热门NLP工具库spaCy与Hugging Face集成，提升AI开发者效率

spaCy正式入驻Hugging Face Hub，用户可直接在Hub上访问其预训练模型、配置文件和词汇表，并通过spacy-huggingface-hub插件一键加载模型。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2021-07-11

What are Diffusion Models?

推荐理由：系统性介绍AI生成模型核心技术，对理解AIGC底层原理有重要价值

文章深入讲解扩散模型的原理、发展及关键技术，涵盖score-based生成建模、classifier-free guidance、latent diffusion等重要进展，并介绍GLIDE、Imagen、LDM等代表性模型。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-07-08

使用 Amazon SageMaker 轻松部署 Hugging Face 模型

推荐理由：实用的 AI 模型部署教程，结合主流平台与开源模型库

本文介绍如何利用 Amazon SageMaker 快速部署 Hugging Face 的 AI 模型，涵盖从模型选择、环境配置到推理服务上线的完整流程，并提供最佳实践和性能优化建议。

阅读原文 →

OpenAI Blog ★★★★☆ 2021-07-07

Evaluating large language models trained on code

推荐理由：聚焦代码大模型评测，契合AI vibe coding与模型评测主题

论文《Evaluating large language models trained on code》提出CodeXGLUE基准，系统评估代码大模型在代码生成、翻译、修复等任务上的性能，涵盖多个数据集和指标，为AI编程模型提供标准化评测框架。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-06-28

Sentence Transformers in the Hugging Face Hub

推荐理由：热门AI工具库推荐，实用性强

介绍 Hugging Face Hub 上的 Sentence Transformers 库，涵盖其文本嵌入模型的使用、微调及在语义搜索、聚类等任务中的应用。

阅读原文 →

OpenAI Blog ★★★☆☆ 2021-06-10

Improving language model behavior by training on a curated dataset

推荐理由：涉及AI模型训练与行为优化，属模型改进技术

研究表明，通过在小型精选数据集上微调，可有效改善语言模型在特定行为价值观上的表现。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-06-03

实践中的少样本学习：GPT-Neo 与 🤗 加速推理 API

推荐理由：涉及大模型应用与推理优化，属热门 AI 工具库实践

文章介绍如何结合 GPT-Neo 和 Hugging Face 的加速推理 API 实现高效的少样本学习，涵盖技术实现、性能优化及实际应用示例。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2021-05-31

Contrastive Representation Learning

推荐理由：介绍AI基础技术，对理解自监督学习有帮助

对比表示学习旨在构建嵌入空间，使相似样本靠近、不相似样本远离，广泛应用于视觉与语言任务的自监督学习中。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-05-25

使用 Gradio 2.0 调用和混合 Hugging Face 模型

推荐理由：实用教程，结合热门 AI 工具库提升开发效率

本文介绍如何利用 Gradio 2.0 快速构建界面，调用并组合多个 Hugging Face 模型，实现多模型协同的 AI 应用原型开发。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2021-04-20

Scaling-up BERT Inference on CPU (Part 1)

推荐理由：涉及AI模型部署优化，对实际应用有参考价值

本文探讨在CPU上高效部署和扩展BERT模型推理的方法，涵盖优化策略与性能调优技巧。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-04-16

介绍 🤗 Accelerate

推荐理由：推荐热门AI工具库，提升训练效率

🤗 Accelerate 是 Hugging Face 推出的开源库，简化多GPU/TPU训练流程，让开发者无需修改代码即可高效扩展模型训练，支持FP8、分布式推理等前沿功能。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-04-08

分布式训练：使用 🤗 Transformers 和 Amazon SageMaker 训练 BART/T5 进行文本摘要

推荐理由：涵盖主流AI模型训练实践与云平台工具链结合，实用性强。

本文介绍如何利用 Hugging Face Transformers 与 Amazon SageMaker 对 BART/T5 模型进行分布式训练，以实现高效文本摘要任务。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-03-31

理解 BigBird 的块稀疏注意力机制

推荐理由：涉及大模型核心技术细节，对理解高效注意力机制有参考价值。

文章深入解析 BigBird 模型采用的块稀疏注意力机制，如何在保持性能的同时降低计算复杂度，适用于长序列建模。

阅读原文 →

OpenAI Blog ★★★★☆ 2021-03-25

GPT-3 powers the next generation of apps

推荐理由：体现GPT-3在真实应用中的商业化落地案例

超过300款应用通过API集成GPT-3，实现搜索、对话、文本补全等AI功能，展示其在实际产品中的广泛应用。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-03-23

合作：Amazon SageMaker 与 Hugging Face

推荐理由：涉及主流 AI 模型服务与云平台集成，实用性强

Amazon SageMaker 与 Hugging Face 深化集成，用户可在 SageMaker 上更便捷地训练、部署 Hugging Face 的开源大模型，简化 AI 模型开发流程。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2021-03-21

Reducing Toxicity in Language Models

推荐理由：涉及AI模型安全与优化，属于模型评测与改进范畴

文章探讨降低语言模型毒性的三种方法：训练数据收集、毒性内容检测和模型去毒，旨在提升AI模型在现实应用中的安全性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-03-18

我在 Google Cloud 上构建无服务器 Transformers 管道的历程

推荐理由：涉及 AI 模型服务部署与云平台实践，具技术参考价值

作者分享在 Google Cloud 上部署无服务器化 Transformers 模型推理管道的实践经验，涵盖 Cloud Run、Vertex AI 和优化技巧。

阅读原文 →