笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2024-02-02

NPHardEval 排行榜：通过复杂度类和动态更新揭示大语言模型的推理能力

推荐理由：涉及大模型推理能力评测，符合AI模型评测兴趣

NPHardEval 是一个评估大语言模型在 NP-hard 等计算复杂度问题上推理能力的新基准，支持动态更新题目以持续测试模型性能。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-02-01

Constitutional AI with Open LLMs

推荐理由：涉及开源大模型与AI对齐技术，契合模型评测与工具库主题

文章探讨如何利用开源大语言模型实现“宪法AI”（Constitutional AI），即通过一套原则或规则引导AI行为，提升其安全性与对齐性，并介绍相关技术路径与开源工具。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-02-01

Hugging Face 文本生成推理现已支持 AWS Inferentia2

推荐理由：涉及热门 AI 推理框架与硬件适配，实用性强

Hugging Face 的 Text Generation Inference（TGI）现已支持 AWS Inferentia2 芯片，可高效部署 Llama、Mistral 等大模型，提升推理性能并降低成本。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-02-01

Patch Time Series Transformer in Hugging Face

推荐理由：热门AI工具库更新，涉及新模型发布与应用

Hugging Face新增PatchTST模型，用于时间序列预测，通过将时间序列分块并结合Transformer架构提升性能。

阅读原文 →

OpenAI Blog ★★★☆☆ 2024-01-31

Building an early warning system for LLM-aided biological threat creation

推荐理由：涉及大模型能力边界与安全评测，契合AI模型评测主题

研究评估大语言模型（如GPT-4）是否可能被用于辅助制造生物威胁，发现其对相关任务准确率仅有轻微提升，为AI安全与风险评估提供初步依据。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-01-31

推出企业场景排行榜：面向真实世界用例的排行榜

推荐理由：聚焦AI商业化落地的真实用例评测，契合用户对AI应用与模型评测的兴趣。

Hugging Face 推出企业场景排行榜，聚焦AI模型在真实商业场景中的表现，涵盖客服、销售、HR等垂直领域，提供基于实际任务的评估基准。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-01-30

使用🤗 Optimum Intel 在至强处理器上加速 StarCoder：Q8/Q4 量化与推测解码

推荐理由：涉及热门AI模型优化工具与推理加速技术，实用性强。

本文介绍如何利用 Hugging Face 的 Optimum Intel 工具在 Intel Xeon CPU 上通过 INT8/INT4 量化和推测解码技术加速 StarCoder 大模型推理，显著提升性能并降低资源消耗。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-01-29

幻觉排行榜：一项衡量大语言模型幻觉的开源计划

推荐理由：涉及大模型评测与幻觉问题，契合AI模型评测兴趣点

该文章介绍了‘幻觉排行榜’，一个开源项目，旨在通过标准化基准测试评估各大语言模型产生幻觉的程度，帮助开发者和用户了解模型可靠性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-01-26

AI Secure 大语言模型安全排行榜介绍

推荐理由：涵盖大模型安全评测与基准对比，符合模型评测兴趣点

文章介绍了 AI Secure 推出的大语言模型安全排行榜，评估主流 LLM 在对抗攻击、越狱、数据泄露等方面的安全性能，并提供基准测试方法和结果对比。

阅读原文 →

OpenAI Blog ★★★★☆ 2024-01-25

New embedding models and API updates

推荐理由：涉及AI模型更新与评测，契合用户关注点

文章介绍了新的嵌入模型及API更新，包括性能提升、多语言支持和更高效的向量表示能力，并提供了使用示例和基准测试结果。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-01-25

Hugging Face 与 Google 携手推动开源 AI 合作

推荐理由：涉及主流 AI 开源平台合作，影响模型生态与开发者工具链

Hugging Face 与 Google 宣布合作，共同推动开源 AI 发展，包括模型共享、工具集成及社区协作，旨在加速 AI 技术的开放创新与应用落地。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-01-24

Open-source LLMs as LangChain Agents

推荐理由：涉及开源LLM与LangChain结合的实用技能，契合AI工具库及skill推荐主题

探讨如何将开源大语言模型（如Llama、Mistral）集成到LangChain中作为智能体使用，涵盖工具调用、记忆机制和代理链构建等实践技巧。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-01-19

使用 🤗 Transformers 对 W2V2-Bert 进行微调，用于低资源语音识别（ASR）

推荐理由：涉及热门AI工具库与语音模型微调实战，契合AI工具与模型应用主题。

本文介绍如何利用 Hugging Face Transformers 库对 Wav2Vec2-BERT 模型进行微调，以在低资源语言环境下实现高效的自动语音识别（ASR），包含代码示例和训练技巧。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-01-19

PatchTSMixer in HuggingFace

推荐理由：热门AI工具库新模型发布，适合时序预测场景

PatchTSMixer 是 Hugging Face 新推出的时序预测模型，基于 MLP 架构，适用于时间序列分析任务，已在 Transformers 库中集成。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-01-18

Preference Tuning LLMs with Direct Preference Optimization Methods

推荐理由：涉及AI模型训练关键技术，属热门研究方向

文章探讨使用直接偏好优化（DPO）等方法对大语言模型进行偏好微调，提升模型输出与人类偏好的一致性，涵盖技术原理、实现方式及效果对比。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-01-15

使用 ONNX Runtime 和 Olive 加速 SD Turbo 和 SDXL Turbo 推理

推荐理由：涉及热门AI模型优化与推理加速工具，属实用技术教程

本文介绍如何利用 ONNX Runtime 和 Olive 工具对 Stable Diffusion Turbo 系列模型进行推理加速，提升生成效率，适用于图像生成等实际应用场景。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-01-14

在 Hugging Face Spaces 上通过 Gradio 免费运行 ComfyUI 工作流

推荐理由：推荐热门 AI 工具 ComfyUI 的免费部署方案，实用性强。

本文介绍如何利用 Hugging Face Spaces 和 Gradio 免费部署和运行 ComfyUI 工作流，降低本地资源门槛，便于快速测试和分享 AI 图像生成流程。

阅读原文 →

OpenAI Blog ★★★☆☆ 2024-01-12

Building agricultural database for farmers

推荐理由：体现AI在农业的商业化应用案例

Digital Green利用OpenAI技术构建农业数据库，帮助农民提高收入，展示了AI在农业领域的实际应用与商业化落地。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-01-12

搭建你自己的 Hugging Face 排行榜指南：以 Vectara 的幻觉排行榜为例的端到端示例

推荐理由：提供实用的 AI 模型评测工具搭建教程，契合用户对模型评测与开源工具的兴趣。

本文通过 Vectara 的幻觉排行榜案例，详细演示如何在 Hugging Face 上搭建自定义模型评测排行榜，涵盖数据准备、评估指标集成和结果可视化等步骤。

阅读原文 →

OpenAI Blog ★★★★☆ 2024-01-10

Introducing the GPT Store

推荐理由：涉及AI模型分发与商业化，符合用户对AI应用生态的关注

OpenAI推出GPT Store，允许用户发现、分享和变现自定义GPT模型，涵盖教育、生产力、编程等多个领域，并计划引入创作者收入分成机制。

阅读原文 →