笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2021-03-12

使用🤗 Transformers在Hugging Face上微调Wav2Vec2实现英文语音识别

推荐理由：实用的AI模型微调教程，适合语音识别开发者

本文介绍如何使用Hugging Face的Transformers库对Wav2Vec2模型进行微调，以实现英文自动语音识别（ASR），涵盖数据准备、训练配置和推理流程。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2021-03-09

Hugging Face Reads, Feb. 2021 - Long-range Transformers

推荐理由：涉及AI模型架构进展，属热门AI工具库相关内容

介绍2021年2月Hugging Face推荐的长距离Transformer模型相关研究，涵盖高效注意力机制和序列建模改进。

阅读原文 →

OpenAI Blog ★★★★☆ 2021-03-04

Multimodal neurons in artificial neural networks

推荐理由：揭示AI模型内部机制，对理解多模态模型有重要价值

研究发现CLIP模型中存在多模态神经元，能对同一概念的不同表现形式（如字面、符号或抽象）作出响应，有助于解释其强大的图像分类能力，并揭示模型学到的关联与偏见。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-02-10

使用 Hugging Face Transformers 和 Ray 实现检索增强生成（RAG）

推荐理由：涵盖热门AI工具库整合与RAG实践技巧

本文介绍如何结合 Hugging Face Transformers 与分布式计算框架 Ray，构建高效的检索增强生成（RAG）系统，提升大模型问答准确性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-02-09

Hugging Face on PyTorch / XLA TPUs

推荐理由：涉及热门AI工具库与硬件加速实践

Hugging Face 官方博客介绍了如何在 PyTorch/XLA 上使用 TPU 进行高效训练，涵盖环境配置、代码适配及性能优化技巧。

阅读原文 →

OpenAI Blog ★★★☆☆ 2021-02-04

Understanding the capabilities, limitations, and societal impact of large language models

推荐理由：涉及大模型能力与局限，契合模型评测与应用关注点

文章深入探讨大语言模型的能力边界、局限性及其对社会的影响，涵盖技术原理、实际应用中的挑战及伦理问题。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-01-26

Hugging Face Transformers 中更快的 TensorFlow 模型

推荐理由：涉及热门 AI 工具库的性能升级，对开发者有实用价值

Hugging Face Transformers 库新增对 TensorFlow 模型的性能优化，提升推理速度并简化部署流程，适用于 NLP 和多模态任务。

阅读原文 →

OpenAI Blog ★★★★☆ 2021-01-25

Scaling Kubernetes to 7,500 nodes

推荐理由：涉及大模型基础设施，与AI模型训练密切相关

OpenAI分享将Kubernetes集群扩展至7500节点的经验，支撑GPT-3、CLIP、DALL·E等大模型训练及小规模快速迭代研究。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-01-19

通过 DeepSpeed 和 FairScale 的 ZeRO 技术实现更大模型和更快训练

推荐理由：涉及主流AI训练框架与大模型训练优化技术，属热门工具库应用

文章介绍 ZeRO（零冗余优化器）技术，通过 DeepSpeed 和 FairScale 实现大模型训练时的显存优化与加速，支持更大规模模型训练并提升效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-01-18

我们如何为🤗 API用户将Transformer推理速度提升100倍

推荐理由：涉及AI模型推理优化技术，对开发者有实用参考价值

Hugging Face团队通过量化、动态批处理和缓存等技术，将Transformer模型推理速度提升100倍，显著优化API响应性能。

阅读原文 →

OpenAI Blog ★★★★☆ 2021-01-05

DALL·E: Creating images from text

推荐理由：涉及AI模型发布及多模态生成技术，属核心AI进展

OpenAI发布DALL·E模型，可根据自然语言文本生成对应图像，展示AI在多模态生成领域的强大能力。

阅读原文 →

OpenAI Blog ★★★★☆ 2021-01-05

CLIP: Connecting text and images

推荐理由：重要多模态模型发布，具零样本能力

OpenAI发布CLIP模型，通过自然语言监督学习视觉概念，支持零样本图像分类，仅需提供类别名称即可应用于各类视觉任务。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2021-01-02

Controllable Neural Text Generation

推荐理由：涵盖AI模型可控生成关键技术，与模型服务优化密切相关

文章综述了可控神经文本生成的多种技术路径，包括引导解码、提示设计（如P-tuning、Prompt Tuning）和微调方法等，旨在让大语言模型生成符合特定属性的内容。

阅读原文 →

Hugging Face Blog ★★★★☆ 2020-11-09

Leveraging Pre-trained Language Model Checkpoints for Encoder-Decoder Models

推荐理由：涉及大模型训练技巧与性能优化，契合AI模型发布及评测主题

本文探讨如何利用预训练语言模型的检查点来初始化编码器-解码器架构，提升模型性能并减少训练成本。

阅读原文 →

Hugging Face Blog ★★★★☆ 2020-11-03

将 fairseq wmt19 翻译系统迁移到 transformers

推荐理由：涉及主流AI工具库迁移实践，对NLP开发者有实用价值

本文介绍了如何将基于 fairseq 的 WMT19 机器翻译系统迁移到 Hugging Face Transformers 库，涵盖模型转换、配置适配及推理优化等关键技术步骤。

阅读原文 →

Hugging Face Blog ★★★★☆ 2020-11-02

使用 Transformers 和 Ray Tune 进行超参数搜索

推荐理由：实用的AI模型调优工具链教程，适合开发者提升训练效率。

本文介绍如何结合 Hugging Face Transformers 与 Ray Tune 实现高效的超参数优化，涵盖分布式调参、早停策略及实际代码示例。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2020-10-29

How to Build an Open-Domain Question Answering System?

推荐理由：涉及AI模型应用与实践，契合AI工具与系统构建主题

文章介绍了构建开放域问答系统（ODQA）的常见方法，包括闭卷和开卷两种范式，并结合预训练语言模型及OpenAI API示例进行说明。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2020-10-10

Transformer-based Encoder-Decoder Models

推荐理由：涵盖主流AI模型架构，对理解大模型基础有帮助

文章介绍基于Transformer的编码器-解码器模型架构，包括其在序列到序列任务中的应用、关键组件及典型变体。

阅读原文 →

OpenAI Blog ★★★★☆ 2020-09-22

OpenAI licenses GPT-3 technology to Microsoft

推荐理由：涉及AI模型商业化授权，符合AI商业化应用主题

OpenAI授权微软使用GPT-3技术，用于其产品和服务，标志着大模型商业化的重要进展。

阅读原文 →

Hugging Face Blog ★★★★☆ 2020-09-10

用于更小更快语言模型的块稀疏矩阵

推荐理由：涉及AI模型优化技术，有助于提升模型效率和落地应用

文章探讨如何利用块稀疏矩阵技术压缩和加速大语言模型，提升推理效率并减少内存占用，适用于部署资源受限场景。

阅读原文 →