笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2022-07-14

BLOOM训练背后的技术

推荐理由：详述主流开源大模型BLOOM的训练技术，契合AI模型发布与评测主题

文章深入解析了开源大模型BLOOM的训练技术细节，包括数据处理、分布式训练架构和优化策略，对理解大模型训练流程具有参考价值。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-07-13

使用 Sentence Transformers 构建播放列表生成器

推荐理由：结合热门AI工具库实现创意应用，具实践参考价值

本文介绍如何利用 Sentence Transformers 模型，基于歌曲描述或用户输入的文本语义，自动生成风格一致的音乐播放列表。

阅读原文 →

Hugging Face Blog ★★★★★ 2022-07-12

推出全球最大的开源多语言语言模型：BLOOM

推荐理由：重磅开源多语言大模型发布，对AI模型研究与应用具重要价值

BLOOM是全球最大的开源多语言大语言模型，支持46种语言，由BigScience合作项目历时一年开发完成，参数规模达1760亿，旨在推动开放、透明的AI研究。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2022-07-07

Getting Started with Sentiment Analysis on Twitter

推荐理由：提供实用的AI技能教程，适合入门情感分析项目

本文介绍如何使用Python和开源库（如Tweepy、TextBlob）对Twitter数据进行情感分析，涵盖数据获取、预处理、模型应用及结果可视化等步骤。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2022-06-30

Policy Gradient with PyTorch

推荐理由：提供主流AI框架下的经典算法实现教程

本文介绍如何使用PyTorch实现策略梯度（Policy Gradient）算法，涵盖强化学习基础、代码实现及训练技巧。

阅读原文 →

OpenAI Blog ★★★☆☆ 2022-06-28

DALL·E 2 pre-training mitigations

推荐理由：涉及AI模型安全机制与内容合规策略，属AI模型发布相关实践。

DALL·E 2在预训练阶段引入多种防护机制，以降低生成违规内容的风险，确保符合内容政策。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-06-28

使用 DeepSpeed 加速大模型训练

推荐理由：深入讲解热门 AI 训练框架 DeepSpeed 的核心技术与实践方法

本文介绍如何利用微软的 DeepSpeed 框架优化和加速大语言模型的训练过程，涵盖 ZeRO 技术、混合精度训练及实际部署技巧。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-06-28

宣布在 Hugging Face Hub 上推出评估功能

推荐理由：涉及 AI 模型评测新工具，符合模型评测与开源生态兴趣

Hugging Face 推出 Hub 上的评估功能，支持对 AI 模型进行标准化自动评测，涵盖多种任务和指标，并与主流框架集成，便于开发者快速比较模型性能。

阅读原文 →

OpenAI Blog ★★★★☆ 2022-06-23

Learning to play Minecraft with Video PreTraining

推荐理由：展示了通用AI智能体在复杂环境中的学习能力，涉及新训练方法和人机交互接口

研究团队通过视频预训练（VPT）方法，利用大量人类玩《我的世界》的无标签视频和少量标注数据，训练出能使用键盘鼠标操作、完成复杂任务（如制作钻石工具）的AI智能体。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-06-23

嵌入（Embeddings）入门指南

推荐理由：嵌入是AI模型理解语义的核心技术，对开发和优化AI应用至关重要。

本文介绍嵌入（Embeddings）的基本概念、生成方法及其在AI应用中的作用，涵盖常见模型如Word2Vec、BERT，并提供使用开源库（如Hugging Face）实操示例。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-06-22

使用 Hugging Face Optimum 将 Transformers 模型转换为 ONNX

推荐理由：实用的模型部署技巧，适合AI开发者优化推理性能。

本文介绍如何利用 Hugging Face Optimum 库将 Transformers 模型高效转换为 ONNX 格式，以提升推理速度和跨平台部署能力。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-06-15

英特尔与 Hugging Face 合作推动机器学习硬件加速普及

推荐理由：涉及主流 AI 工具库优化与硬件加速落地，对开发者有实用价值

英特尔与 Hugging Face 合作，通过优化 Transformers 库和 OpenVINO 工具套件，提升在英特尔 CPU、GPU 和 NPU 上的 AI 模型推理性能，降低硬件加速门槛。

阅读原文 →

OpenAI Blog ★★★★☆ 2022-06-13

AI-written critiques help humans notice flaws

推荐理由：涉及AI辅助人类评估AI生成内容，契合AI vibe coding与人机协作主题

研究训练AI模型撰写摘要的批评意见，帮助人类更易发现其中缺陷。更大模型在自我批评方面表现更优，表明AI可辅助人类监督复杂任务中的AI输出。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2022-06-09

Generalized Visual Language Models

推荐理由：涉及多模态AI模型的技术实现，属于AI模型研究范畴

文章探讨如何扩展预训练的通用语言模型，使其能够处理视觉信号，以解决视觉语言任务，如图像描述和视觉问答。

阅读原文 →

OpenAI Blog ★★★★☆ 2022-06-09

Techniques for training large neural networks

推荐理由：涉及大模型训练关键技术，契合AI模型研发主题

文章探讨了训练大型神经网络的技术挑战，包括如何协调GPU集群以执行同步计算，涉及AI模型训练的核心工程问题。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-06-07

The Annotated Diffusion Model

推荐理由：详解扩散模型核心代码，对AI开发者极具参考价值

本文深入解析扩散模型的实现细节，逐行注释代码，涵盖去噪过程、调度策略及训练技巧，适合想深入理解生成模型原理的开发者。

阅读原文 →

OpenAI Blog ★★★★☆ 2022-06-02

Best practices for deploying language models

推荐理由：涉及大模型部署实践，对AI工程化有参考价值

Cohere、OpenAI 和 AI21 Labs 联合提出一套适用于大模型开发与部署的初步最佳实践指南，涵盖安全、可靠性与责任等方面。

阅读原文 →

OpenAI Blog ★★★★☆ 2022-05-28

Teaching models to express their uncertainty in words

推荐理由：涉及AI模型输出可靠性，对AI应用落地有实际意义

文章探讨如何训练AI模型用自然语言表达其预测的不确定性，例如说“我不确定”或“这可能不准确”，以提升人机交互的可靠性与透明度。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2022-05-26

Graphcore 与 Hugging Face 推出全新支持 IPU 的 Transformer 模型系列

推荐理由：涉及 AI 模型适配新硬件平台，属模型服务优化范畴

Graphcore 联合 Hugging Face 发布专为 IPU（智能处理器）优化的 Transformer 模型系列，涵盖多种主流架构，旨在提升在 Graphcore 硬件上的训练和推理效率。

阅读原文 →

OpenAI Blog ★★★☆☆ 2022-05-24

Powering next generation applications with OpenAI Codex

推荐理由：涉及Codex在实际应用中的部署，契合AI商业化与工具使用主题

OpenAI Codex 通过 API 支持70多个应用，覆盖多种使用场景，展示其在AI辅助编程和应用开发中的广泛落地。

阅读原文 →