笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2022-10-19

MTEB：大规模文本嵌入基准

推荐理由：提供权威的嵌入模型评测标准，对选型和优化有重要参考价值

MTEB（Massive Text Embedding Benchmark）是一个用于评估文本嵌入模型性能的大规模基准测试，涵盖56个数据集、112项任务，覆盖检索、聚类、分类等多个场景。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-10-14

Hugging Face 推理端点入门指南

推荐理由：实用的 AI 模型部署工具教程，适合开发者快速上手

本文介绍如何使用 Hugging Face Inference Endpoints 快速部署和调用大模型，涵盖创建端点、选择模型、配置硬件及调用 API 等关键步骤。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-10-13

🧨 在 JAX / Flax 中实现的 Stable Diffusion！

推荐理由：推荐给关注AI开源工具和高性能模型实现的开发者。

该项目展示了如何使用 JAX 和 Flax 框架高效实现 Stable Diffusion，利用其函数式编程和自动并行能力提升生成速度与训练效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-10-12

Optimization story: Bloom inference

推荐理由：涉及大模型推理优化，对AI工程落地有参考价值

文章讲述了Bloom大模型推理过程的优化实践，包括性能瓶颈分析、内存占用改进和推理速度提升等技术细节。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2022-10-05

Japanese Stable Diffusion

推荐理由：涉及AI模型发布及本地化应用

介绍日本团队推出的Stable Diffusion模型变体，针对日语文本和本地文化优化，在生成动漫风格图像方面表现突出。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-10-03

Very Large Language Models and How to Evaluate Them

推荐理由：涉及大模型评测方法，契合用户对模型评测的兴趣

文章探讨超大规模语言模型的评估方法，涵盖基准测试、性能指标及实际应用中的评测挑战。

阅读原文 →

OpenAI Blog ★★★☆☆ 2022-09-28

DALL·E now available without waitlist

推荐理由：涉及主流AI模型服务的可用性更新，属模型服务发布范畴

DALL·E 现已取消等待列表，新用户可立即使用。该更新基于部署经验及安全系统的改进，支持更广泛的开放访问。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-09-28

Image Classification with AutoTrain

推荐理由：实用AI工具教程，降低图像分类开发门槛

介绍使用Hugging Face AutoTrain进行图像分类的端到端流程，涵盖数据准备、模型训练与部署，适合快速构建AI图像识别应用。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-09-27

🤗 Accelerate 如何借助 PyTorch 运行超大模型

推荐理由：介绍热门 AI 工具库 Accelerate 的核心技术与使用方法

文章介绍了 Hugging Face 的 Accelerate 库如何利用 PyTorch 实现超大模型的高效训练与推理，支持多 GPU/TPU 和内存优化技术。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-09-26

SetFit：无需提示的高效小样本学习

推荐理由：推荐热门AI工具库及小样本学习新方法

SetFit是一种新型小样本学习方法，无需依赖提示（prompt）或大规模微调，通过对比学习和少量标注样本即可实现高效文本分类。

阅读原文 →

OpenAI Blog ★★★★☆ 2022-09-21

Introducing Whisper

推荐理由：大模型新发布且具实用价值

OpenAI发布Whisper，一个基于大规模多语言数据训练的自动语音识别（ASR）模型，支持转录和翻译，在多种基准测试中表现优异。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-09-16

使用 DeepSpeed 和 Accelerate 实现超快的 BLOOM 推理

推荐理由：涉及大模型推理优化工具链，实用性强

本文介绍如何结合 DeepSpeed 和 Hugging Face 的 Accelerate 库，显著加速 BLOOM 大模型的推理过程，提升部署效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-09-12

Diffusers 有什么新功能？🎨

推荐理由：Diffusers是热门AI生成工具库，更新内容对开发者有实用价值。

介绍Hugging Face Diffusers库的最新更新，包括新模型支持、性能优化及AI图像生成相关功能增强。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-09-08

Train your first Decision Transformer

推荐理由：涉及热门AI模型实践教程，契合AI工具库与技能推荐主题

本文介绍如何训练首个Decision Transformer模型，这是一种将强化学习问题转化为序列建模任务的AI方法，适用于离线强化学习场景。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-09-07

如何使用 Megatron-LM 训练语言模型

推荐理由：覆盖热门 AI 工具库 Megatron-LM 的实战教程，适合开发者学习大模型训练。

本文详细介绍如何利用 NVIDIA 的 Megatron-LM 框架训练大规模语言模型，涵盖环境配置、数据准备、分布式训练设置及性能优化技巧。

阅读原文 →

OpenAI Blog ★★★☆☆ 2022-08-31

DALL·E: Introducing outpainting

推荐理由：涉及AI图像生成模型新功能发布，属AI模型服务更新

DALL·E 推出 outpainting 功能，允许用户扩展图像边界，生成任意尺寸的创意图像，增强视觉叙事能力。

阅读原文 →

OpenAI Blog ★★★★☆ 2022-08-24

Our approach to alignment research

推荐理由：涉及AI对齐核心技术，影响模型安全性与可靠性

OpenAI介绍其AI对齐研究方法，聚焦于提升AI从人类反馈中学习及辅助人类评估AI的能力，旨在构建能解决其他对齐问题的高对齐AI系统。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-08-24

在 Hugging Face Spaces 上可视化蛋白质

推荐理由：展示了 AI 在生物科学中的实际工具应用，涉及热门平台和开源模型。

本文介绍如何使用 Hugging Face Spaces 部署蛋白质结构可视化应用，结合 AI 模型（如 ESMFold）实现交互式 3D 蛋白质结构展示。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-08-22

使用🧨 Diffusers实现Stable Diffusion

推荐理由：推荐热门AI工具库Diffusers的实战教程

本文介绍如何使用Hugging Face的Diffusers库运行和微调Stable Diffusion模型，涵盖安装、推理、自定义管道及性能优化技巧。

阅读原文 →

Hugging Face Blog ★★★★☆ 2022-08-22

使用 Hugging Face Transformers 和 Habana Gaudi 预训练 BERT

推荐理由：涉及主流 AI 工具库与模型训练实践，适合开发者参考。

本文介绍如何利用 Hugging Face Transformers 库和 Habana Gaudi 加速器从头预训练 BERT 模型，涵盖数据准备、配置优化及训练流程。

阅读原文 →