笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2024-07-22

WWDC 24：使用 Core ML 运行 Mistral 7B

推荐理由：涉及大模型本地部署与性能优化，属热门AI工具链实践

苹果在 WWDC 24 上展示了如何通过 Core ML 在本地设备高效运行 Mistral 7B 开源大模型，涵盖模型转换、优化及推理性能。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-18

Docmatix - a huge dataset for Document Visual Question Answering

推荐理由：涉及AI模型训练数据集发布，属热门AI工具资源

Docmatix是一个用于文档视觉问答（DocVQA）的大规模数据集，包含数百万份真实文档及对应问题-答案对，旨在推动AI在复杂文档理解任务上的能力。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-18

TGI Multi-LoRA：一次部署，服务30个模型

推荐理由：介绍热门AI推理框架新特性，实用性强

Hugging Face 推出 TGI Multi-LoRA 功能，允许在单个 Text Generation Inference 实例上同时托管多达30个 LoRA 微调模型，显著降低部署成本并提升推理效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-16

SmolLM——极速且强大的小型语言模型

推荐理由：热门开源AI模型发布及评测，符合工具库与模型评测兴趣

Hugging Face发布SmolLM系列开源小模型，在多项基准测试中表现优异，兼顾推理速度与性能，适合本地和边缘设备部署。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-16

我们如何利用 distilabel 构建 Argilla 2.0 聊天机器人

推荐理由：涉及热门AI工具链与实践教程，适合AI开发者参考。

文章介绍了使用开源工具 distilabel 结合 Argilla 2.0 构建高质量 AI 聊天机器人的流程，涵盖数据合成、模型微调与评估等关键步骤。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-11

NuminaMath 如何赢得首届 AIMO 进步奖

推荐理由：涉及 AI 模型在专业领域的性能突破与评测

NuminaMath 凭借其在 AI 数学推理领域的创新方法，赢得了首届 AIMO（AI for Math Olympiad）进步奖，展示了专用模型在复杂数学问题求解上的突破。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-10

宣布 Hugging Face 与 KerasHub 的新集成

推荐理由：热门 AI 工具库整合，提升开发效率

Hugging Face 与 KerasHub 集成，使 TensorFlow/Keras 用户能直接加载和使用 Hugging Face Hub 上的模型，简化 AI 模型调用流程。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2024-07-10

使用 Presidio 在 Hugging Face Hub 上实验自动 PII 检测

推荐理由：涉及热门AI工具Presidio在数据处理中的实际应用，契合AI工具库推荐主题。

文章介绍如何利用开源工具 Presidio 在 Hugging Face Hub 上自动检测数据集中的个人身份信息（PII），提升数据隐私与合规性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-10

Preference Optimization for Vision Language Models

推荐理由：涉及AI模型优化技术，属热门研究方向

本文探讨视觉语言模型（VLM）的偏好优化方法，通过人类反馈提升模型对齐能力，在多模态任务中表现更优。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-09

Google Cloud TPU 向 Hugging Face 用户开放

推荐理由：涉及AI基础设施与主流平台集成，对模型训练效率提升有实际价值

Google Cloud 宣布其TPU（张量处理单元）现已向Hugging Face用户开放，便于开发者更高效地训练和部署AI模型，尤其适用于大模型场景。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-09

法国领土银行（CDC集团）x Polyconseil x Hugging Face：通过主权数据解决方案增强法国重大环境计划

推荐理由：体现AI在环保领域的商业化应用与实际案例

Hugging Face携手法国机构，利用AI与主权数据平台支持国家级环境项目，展示AI在公共政策与可持续发展中的落地应用。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-03

在 Intel Gaudi 2 上加速蛋白质语言模型 ProtST

推荐理由：涉及 AI 模型在专用硬件上的性能评测与优化，属 AI 模型服务发布及评测范畴。

文章介绍如何在 Intel Gaudi 2 硬件上优化和加速蛋白质语言模型 ProtST 的推理与训练，涵盖性能调优技巧和基准测试结果。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-01

我们的 Transformers 代码智能体在 GAIA 基准测试中胜出 🏅

推荐理由：涉及AI模型评测与前沿Agent技术，契合AI模型发布及评测主题。

Hugging Face 推出基于 Transformers 的代码智能体，在 GAIA 基准测试中表现优异，展示了其在复杂多步推理和工具调用任务上的强大能力。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-06-27

欢迎 Gemma 2 — Google 推出的新一代开源大语言模型

推荐理由：属于大模型新版本发布及评测范畴，技术细节丰富

Google 发布 Gemma 2，新一代开源大语言模型，提供多种参数规模，在推理、编码和多语言任务上性能显著提升，并兼容主流AI框架。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-06-25

XLSCOUT 推出 ParaEmbed 2.0：专为专利和知识产权打造的嵌入模型，获 Hugging Face 专家支持

推荐理由：聚焦垂直领域嵌入模型发布，契合AI模型评测与行业应用兴趣

XLSCOUT 发布 ParaEmbed 2.0，一款专为专利和知识产权文本优化的嵌入模型，结合领域专业知识与 Hugging Face 技术支持，提升专利检索与分析效果。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-06-24

微调 Florence-2 —— 微软前沿视觉语言模型

推荐理由：涉及热门AI模型发布与实操教程，适合开发者学习应用

本文介绍如何对微软最新发布的多模态视觉语言模型 Florence-2 进行微调，涵盖数据准备、训练流程及性能优化技巧。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-06-18

BigCodeBench：下一代 HumanEval

推荐理由：涉及AI编程模型评测基准，契合AI vibe coding与模型评测主题

BigCodeBench 是一个新推出的代码生成模型评测基准，旨在替代并扩展 HumanEval，覆盖更多编程语言、真实场景任务和复杂性更高的问题，提升对 AI 编程能力的评估准确性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-06-13

从 DeepSpeed 到 FSDP 再回到 Hugging Face Accelerate

推荐理由：涵盖热门AI训练框架与工具库的实战技巧，适合开发者参考。

本文介绍如何使用 Hugging Face Accelerate 在 DeepSpeed 和 PyTorch FSDP 之间切换，简化大模型训练的分布式配置，提升开发效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-06-12

Diffusers 迎来 Stable Diffusion 3

推荐理由：热门AI工具库集成最新多模态大模型，实用性强

Hugging Face 的 Diffusers 库现已支持 Stable Diffusion 3，开发者可直接调用该模型进行图像生成，提升创作效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-06-12

Putting RL back in RLHF

推荐理由：涉及大模型训练核心技术，对AI开发者有参考价值

文章探讨如何在RLHF（基于人类反馈的强化学习）中更有效地利用强化学习（RL），提出改进训练稳定性和样本效率的新方法，涉及大模型对齐技术的底层优化。

阅读原文 →