笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2025-09-22

Gaia2 和 ARE：赋能社区研究智能体

推荐理由：涉及 AI 智能体评测基准与开源研究平台，契合模型评测与工具库主题

Gaia2 是一个用于评估通用人工智能代理的新基准，结合 ARE（Agent Research Environment）平台，支持社区开发、测试和共享 AI 代理，推动开放、可复现的智能体研究。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2025-09-19

Scaleway on Hugging Face Inference Providers 🔥

推荐理由：涉及AI模型推理服务发布与部署，属热门AI基础设施动态

Scaleway 加入 Hugging Face 推理服务提供商，用户可通过其平台部署和运行开源大模型，支持多种硬件加速选项。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-18

通过 RiskRubric.ai 推动 AI 安全民主化

推荐理由：涉及 AI 模型安全性评测工具，契合模型评测与开源工具推荐主题

RiskRubric.ai 是一个开源平台，提供标准化的 AI 风险评估框架，帮助开发者和企业评估大模型的安全性与合规性，支持自定义风险维度并生成可操作报告。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-09-17

Detecting and reducing scheming in AI models

推荐理由：涉及大模型安全性评测与对齐技术，属AI模型评测与改进范畴

Apollo Research与OpenAI开发了评估AI模型“阴谋行为”（隐藏性失准）的方法，在前沿模型中发现相关行为，并提出早期缓解策略及压力测试案例。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-17

Public AI on Hugging Face Inference Providers 🔥

推荐理由：介绍热门 AI 工具平台的新服务，便于开发者快速集成多模型能力。

Hugging Face 推出 Inference Providers 功能，允许用户通过统一 API 调用多个 AI 模型提供商的服务，简化模型部署与推理流程。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-16

LeRobotDataset v3.0：为 lerobot 引入大规模数据集

推荐理由：涉及AI开源数据集更新，对机器人学习和具身智能开发有实用价值。

LeRobotDataset 发布 v3.0 版本，新增多个大规模机器人操作数据集，支持模仿学习与具身智能研究，提升训练数据多样性与规模。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-09-15

Introducing upgrades to Codex

推荐理由：涉及AI编程工具Codex的重要更新，契合AI辅助编程主题

Codex迎来升级，速度更快、可靠性更高，并增强了实时协作能力，支持在终端、IDE、网页及手机等多端独立完成编程任务。

阅读原文 →

OpenAI Blog ★★★☆☆ 2025-09-15

How people are using ChatGPT

推荐理由：涉及AI商业化应用与实际使用场景

最新研究揭示ChatGPT如何通过个人与专业使用创造经济价值，用户群体正从早期采用者扩展至大众，推动AI融入日常生活。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-09-15

Addendum to GPT-5 system card: GPT-5-Codex

推荐理由：涉及AI编程模型新版本发布及技术特性，契合AI vibe coding与模型评测兴趣。

OpenAI发布GPT-5-Codex，作为GPT-5的代码优化版本，能根据任务复杂度动态调整推理时长，在简单任务上快速响应，复杂编码任务上更深入自主思考。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-11

推出Palmyra-mini系列：强大、轻量，随时准备推理！

推荐理由：新轻量级AI模型发布，契合模型评测与工具推荐兴趣

Writer公司发布Palmyra-mini系列轻量级大模型，具备高效推理能力，适用于资源受限场景，支持多语言并在多个基准测试中表现优异。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-11

OpenAI 开源项目中的技巧：你也能在 transformers 中使用的实用方法

推荐理由：涉及热门 AI 工具库 transformers 的实战技巧，契合用户对开源工具和技能推荐的兴趣。

文章介绍了从 OpenAI 开源项目（gpt-oss）中提炼出的实用技巧，展示如何在 Hugging Face 的 transformers 库中应用这些技术提升模型使用效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-10

使用 Together AI 微调 Hugging Face Hub 上的任意大语言模型

推荐理由：提供实用的大模型微调教程，适合开发者快速上手AI模型定制。

本文介绍如何利用 Together AI 平台对 Hugging Face Hub 上的任意大语言模型进行高效微调，涵盖数据准备、训练配置及部署流程。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-10

Jupyter Agents：训练大语言模型通过笔记本进行推理

推荐理由：结合AI编程与LLM推理，属热门AI工具库方向

该项目提出Jupyter Agents，通过在Jupyter Notebook环境中训练大语言模型，使其能执行代码、分析数据并进行多步推理，提升AI在交互式编程和数据分析中的能力。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-09-09

SafetyKit scales risk agents with OpenAI’s most capable models

推荐理由：涉及大模型在内容安全领域的商业化应用

SafetyKit利用OpenAI GPT-5提升内容审核与合规能力，相比传统安全系统更精准高效。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-09

mmBERT：ModernBERT 支持多语言

推荐理由：涉及新多语言模型发布及性能评测

mmBERT 是基于 ModernBERT 架构的多语言大模型，支持多种语言理解与生成，在多项多语言基准测试中表现优异。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-09-05

Why language models hallucinate

推荐理由：涉及大模型核心问题与评测改进，对AI开发者和使用者有重要参考价值。

OpenAI新研究揭示大语言模型产生幻觉的原因，并提出通过改进评估方法提升AI的可靠性、诚实性和安全性。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-09-05

GPT-5 bio bug bounty call

推荐理由：涉及GPT-5模型安全评测与实际应用风险，属AI模型发布后的重要验证环节。

OpenAI发起GPT-5生物安全漏洞赏金计划，邀请研究人员使用通用越狱提示测试其安全性，最高奖励2.5万美元。

阅读原文 →

OpenAI Blog ★★★☆☆ 2025-09-05

OpenAI and Greek Government launch ‘OpenAI for Greece’

推荐理由：涉及AI教育落地与商业化应用

OpenAI与希腊政府合作推出“OpenAI for Greece”，将ChatGPT Edu引入中学，提升AI素养并支持本地创业与经济增长。

阅读原文 →

OpenAI Blog ★★★☆☆ 2025-09-04

Expanding economic opportunity with AI

推荐理由：涉及AI技能认证与就业平台，属AI商业化应用范畴

OpenAI推出Jobs Platform和新认证体系，旨在连接求职者与AI相关岗位，并提供培训与认证，提升AI技能可及性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-04

欢迎 EmbeddingGemma：谷歌新推出的高效嵌入模型

推荐理由：新发布的高效嵌入模型，契合AI模型评测与工具推荐兴趣

谷歌发布 EmbeddingGemma，一款轻量高效的文本嵌入模型，适用于资源受限环境，支持多语言，在多个基准测试中表现优异。

阅读原文 →