笑笑乐园 - 朝花夕拾

Lilian Weng's Blog ★★★☆☆ 2021-12-05

Learning with not Enough Data Part 1: Semi-Supervised Learning

推荐理由：涉及AI模型训练核心技术，适用于数据稀缺场景

本文介绍半监督学习，探讨在标注数据不足时如何结合少量标签与大量无标签数据提升模型性能，属于AI模型训练的重要技术方向。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-11-30

使用 Optimum 在 IPU 上入门 Hugging Face Transformers

推荐理由：涉及热门 AI 工具库 Optimum 与硬件加速实践，适合开发者参考。

本文介绍如何通过 Hugging Face 的 Optimum 库在 Graphcore IPU 上高效运行 Transformers 模型，涵盖安装、配置及优化技巧。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-11-29

介绍数据测量工具：一个用于查看数据集的交互式工具

推荐理由：推荐给关注AI数据质量与开源工具的开发者

Hugging Face 推出 Data Measurements Tool，帮助用户交互式探索和分析机器学习数据集的特性，如分布、重复、语言构成等，提升数据透明度与质量评估能力。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-11-19

利用英特尔技术加速 PyTorch 分布式微调

推荐理由：涉及主流AI框架优化及高性能训练实践，属热门工具库应用

本文介绍如何结合英特尔硬件（如 Sapphire Rapids CPU）与软件优化（如 Intel Extension for PyTorch）加速 PyTorch 分布式微调，提升训练效率并降低资源消耗。

阅读原文 →

OpenAI Blog ★★★☆☆ 2021-11-18

OpenAI’s API now available with no waitlist

推荐理由：涉及主流AI模型服务开放，影响开发者使用

OpenAI宣布其API取消等待列表，现已向更多用户开放，此举得益于其在安全方面的进展。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-11-15

使用 🤗 Transformers 对 XLSR-Wav2Vec2 进行微调以实现低资源语音识别

推荐理由：涉及热门AI模型微调实践，属AI工具库应用教程

本文介绍如何利用 Hugging Face Transformers 库对 XLSR-Wav2Vec2 模型进行微调，用于低资源语言的自动语音识别（ASR），涵盖数据准备、训练配置和评估方法。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-11-04

在现代CPU上扩展BERT类模型推理——第二部分

推荐理由：涉及AI模型推理优化，对部署实践有参考价值

本文深入探讨如何在现代CPU上高效部署和加速BERT类模型的推理，涵盖算子优化、内存布局调整及并行策略等关键技术。

阅读原文 →

OpenAI Blog ★★★★☆ 2021-10-29

Solving math word problems

推荐理由：涉及AI模型在特定任务上的性能突破与评测

新系统解决小学数学应用题的准确率接近人类儿童水平，比微调后的GPT-3准确率高出近一倍，在相同测试中得分55%（儿童为60%）。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-10-26

Large Language Models: A New Moore's Law?

推荐理由：涉及大模型发展趋势与性能演进，契合模型评测与行业应用主题

文章探讨大语言模型的发展是否正形成类似摩尔定律的规律，分析其性能提升、规模增长与成本变化趋势，并讨论对AI行业的影响。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-10-25

使用10亿训练对训练句子嵌入模型

推荐理由：涉及AI模型训练方法与开源实践，属热门AI工具库范畴

本文介绍如何利用10亿规模的句子对数据集训练高性能句子嵌入模型，涵盖数据构建、模型架构选择及训练技巧，适用于语义搜索和文本匹配等场景。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-10-20

机器学习即代码的时代已经到来

推荐理由：契合AI辅助编程与工具链主题，具实践指导价值

文章探讨了将机器学习模型开发视为软件工程实践的新范式，强调使用现代AI IDE、版本控制和测试框架提升ML开发效率，并介绍相关工具链如MLflow、Weights & Biases及GitHub Copilot在ML项目中的应用。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-10-13

Fine tuning CLIP with Remote Sensing (Satellite) images and captions

推荐理由：涉及AI模型微调与多模态应用，属热门技术实践

文章介绍如何使用遥感卫星图像及其对应文本描述对CLIP模型进行微调，以提升其在地球观测等专业领域的图文理解能力。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-10-05

使用 Streamlit 在 Hugging Face Spaces 上托管你的模型和数据集

推荐理由：实用的AI工具部署教程，结合热门平台与框架

本文介绍如何利用 Streamlit 在 Hugging Face Spaces 上快速部署和共享机器学习模型与数据集，适合开发者轻松构建交互式AI应用。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-10-05

Showcase Your Projects in Spaces using Gradio

推荐理由：推荐热门 AI 工具 Gradio 在实际项目中的应用

Hugging Face Spaces 现支持通过 Gradio 快速部署和展示 AI 项目，简化了模型 Demo 的创建与分享流程。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2021-09-24

How to Train Really Large Models on Many GPUs?

推荐理由：涵盖大模型训练核心技术，对AI开发者有实用价值

文章综述了在多GPU上训练超大神经网络的关键技术，包括多种并行训练范式、模型架构优化和显存节省策略，并链接到OpenAI博客的升级版内容。

阅读原文 →

OpenAI Blog ★★★☆☆ 2021-09-23

Summarizing books with human feedback

推荐理由：涉及AI模型训练与人类反馈机制，属AI模型优化方向

探讨如何通过人类反馈扩展对AI系统的监督，以提升AI在难以评估任务（如书籍摘要）中的表现。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-09-14

Hugging Face 与 Graphcore 合作推出 IPU 优化的 Transformers

推荐理由：涉及热门 AI 工具库优化及硬件适配，对开发者有实用价值

Hugging Face 与 Graphcore 合作，为 Graphcore 的 IPU（智能处理器）优化其 Transformers 库，提升大模型在 IPU 上的训练和推理效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2021-09-14

推出 Optimum：面向大规模 Transformer 的优化工具包

推荐理由：推荐热门 AI 工具库，助力高效模型部署

Hugging Face 推出 Optimum，一个用于优化 Transformer 模型推理和训练的开源工具包，支持 ONNX、Intel OpenVINO、NVIDIA TensorRT 等后端，提升模型部署效率。

阅读原文 →

OpenAI Blog ★★★★☆ 2021-09-08

TruthfulQA: Measuring how models mimic human falsehoods

推荐理由：涉及AI模型评测与真实性评估，契合模型评测主题

TruthfulQA是一个用于评估大模型生成内容真实性的基准数据集，通过衡量模型模仿人类错误陈述的倾向，帮助识别和减少AI幻觉问题。

阅读原文 →

OpenAI Blog ★★★★☆ 2021-08-10

OpenAI Codex

推荐理由：涉及AI编程核心模型更新，与AI辅助编程直接相关

OpenAI发布了改进版Codex，该AI系统可将自然语言转为代码，并通过API开启私测。

阅读原文 →