笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2022-03-02

BERT 101 - 最先进的NLP模型详解

推荐理由：详解主流NLP模型BERT，契合AI模型评测与技术学习需求

文章深入浅出地讲解了BERT模型的原理、架构及其在自然语言处理中的核心地位，适合希望理解主流AI语言模型的技术读者。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2022-02-20

Learning with not Enough Data Part 2: Active Learning

推荐理由：涉及AI模型训练中的数据效率优化技术，属热门AI技能

本文介绍主动学习（Active Learning）方法，用于在标注预算有限的情况下，智能选择最有价值的样本进行人工标注，以提升监督学习模型性能。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-02-11

使用 🤗 Transformers 微调 ViT 进行图像分类

推荐理由：实用的AI模型微调教程，适合开发者快速上手ViT

本文介绍如何使用 Hugging Face Transformers 库微调 Vision Transformer（ViT）模型，实现自定义图像分类任务，涵盖数据准备、训练配置和推理流程。

阅读原文 →

OpenAI Blog ★★★★☆ 2022-02-02

Solving (some) formal math olympiad problems

推荐理由：涉及AI在形式化数学领域的前沿应用与模型能力突破

研究团队开发了一个基于Lean的神经定理证明器，能解决包括AMC12、AIME及IMO改编题在内的高难度数学竞赛问题。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2022-02-02

Getting Started with Sentiment Analysis using Python

推荐理由：推荐给想了解AI基础NLP技能的开发者

本文介绍如何使用Python进行情感分析，涵盖常用库如NLTK、TextBlob和Transformers的实战示例，适合初学者入门AI文本分析任务。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-02-01

使用🤗 Transformers中的Wav2Vec2实现大文件自动语音识别

推荐理由：涉及热门AI工具库的实际应用技巧，适合开发者参考

本文介绍如何利用Hugging Face Transformers库中的Wav2Vec2模型处理大型音频文件的自动语音识别（ASR），包括分块处理、内存优化和推理技巧。

阅读原文 →

OpenAI Blog ★★★★☆ 2022-01-27

Aligning language models to follow instructions

推荐理由：涉及大模型对齐与指令遵循核心技术，属AI模型优化关键方向

本文探讨如何通过指令微调（instruction tuning）使语言模型更好地遵循人类指令，提升模型在未见任务上的泛化能力，并介绍相关训练方法与评估基准。

阅读原文 →

OpenAI Blog ★★★★☆ 2022-01-25

Introducing text and code embeddings

推荐理由：涉及AI模型服务新功能发布及技术应用

OpenAI 推出新的嵌入（embeddings）API 端点，支持文本和代码的语义搜索、聚类、主题建模与分类等任务。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-01-25

🤗 Hub 上的超强搜索功能

推荐理由：介绍热门AI平台的新功能，有助于高效使用开源模型资源。

Hugging Face Hub 推出了增强版搜索功能，支持按模型架构、任务、数据集等多维度筛选，提升用户查找AI模型和数据集的效率。

阅读原文 →

OpenAI Blog ★★★★☆ 2022-01-24

Text and code embeddings by contrastive pre-training

推荐理由：涉及AI编程核心嵌入技术，对AI辅助编程工具开发有参考价值

文章介绍通过对比预训练方法构建文本和代码嵌入模型，提升代码搜索、克隆检测等任务效果，适用于AI编程工具底层技术。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-01-21

欢迎 Stable-baselines3 加入 Hugging Face Hub 🤗

推荐理由：热门强化学习库上线 Hugging Face，方便AI开发者使用和分享模型。

Stable-baselines3 现已集成至 Hugging Face Hub，便于用户共享、加载和复现强化学习模型，提升开发效率与协作便利性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-01-13

案例研究：使用 Hugging Face Infinity 和现代 CPU 实现毫秒级延迟

推荐理由：介绍高效部署大模型的实用方案，契合 AI 工具库与商业化落地主题

本文展示了如何利用 Hugging Face Infinity 平台结合现代 CPU，在不依赖 GPU 的情况下实现大模型推理的毫秒级延迟，适用于成本敏感型 AI 应用场景。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-01-12

在🤗 Transformers中使用n-gram增强Wav2Vec2

推荐理由：涉及热门AI工具库与语音模型优化技巧

本文介绍如何在Hugging Face Transformers库中结合n-gram语言模型提升Wav2Vec2语音识别性能，提供代码示例和实践技巧。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-01-11

使用 Hugging Face Transformers 和 Amazon SageMaker 部署 GPT-J 6B 进行推理

推荐理由：提供大模型部署实操教程，适合AI开发者参考

本文详细介绍了如何利用 Hugging Face Transformers 和 Amazon SageMaker 部署 GPT-J 6B 大模型进行推理，涵盖环境配置、模型优化及部署流程。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-12-23

Active Learning with AutoNLP and Prodigy

推荐理由：涉及热门AI工具链与高效训练方法

本文介绍如何结合AutoNLP与Prodigy实现主动学习，提升AI模型训练效率，涵盖工具集成方法与实战技巧。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-12-21

Gradio is joining Hugging Face!

推荐理由：Gradio 是热门AI工具库，整合Hugging Face对AI开发工作流有重要影响。

Gradio 宣布加入 Hugging Face，将深度整合其机器学习模型展示与部署能力，为开发者提供更流畅的AI应用构建体验。

阅读原文 →

OpenAI Blog ★★★★☆ 2021-12-16

WebGPT: Improving the factual accuracy of language models through web browsing

推荐理由：涉及大模型能力增强与事实性改进，属AI模型技术进展

OpenAI通过微调GPT-3，使其能使用文本浏览器搜索网页信息，从而提升开放式问答的事实准确性，形成WebGPT模型。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-12-15

Perceiver IO：一种可扩展的全注意力模型，适用于任意模态

推荐理由：介绍新型多模态AI模型架构，属模型发布与技术评测范畴

Perceiver IO 是 DeepMind 提出的通用架构，通过交叉注意力处理任意模态输入（如图像、音频、文本），突破传统 Transformer 的长度限制，具备良好的可扩展性。

阅读原文 →

OpenAI Blog ★★★★☆ 2021-12-14

Customizing GPT-3 for your application

推荐理由：涉及大模型定制化与实际应用，符合AI模型服务发布及使用主题

介绍如何通过单条命令对GPT-3进行微调，以适配特定应用场景，提升模型在垂直任务上的表现。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-12-08

从零训练 CodeParrot 🦜

推荐理由：涵盖AI辅助编程模型的完整训练流程，实用性强

本文详细介绍了从零开始训练 CodeParrot（一个类似 GitHub Copilot 的代码生成模型）的全过程，包括数据准备、模型架构选择、训练技巧及开源代码。

阅读原文 →