笑笑乐园 - 朝花夕拾

OpenAI Blog ★★★☆☆ 2025-10-09

Defining and evaluating political bias in LLMs

推荐理由：涉及大模型评测与偏见控制，属AI模型评测范畴

OpenAI提出新方法评估ChatGPT中的政治偏见，通过真实场景测试提升模型客观性并减少偏见。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-10-08

HiBob turns 2,500 GPTs into product and team growth

推荐理由：展示AI在HR SaaS产品中的规模化落地与商业化应用

HiBob利用ChatGPT Enterprise和2500个定制GPT，推动产品与团队增长，提升营收并优化HR工作流，将AI能力集成到Bob平台中。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-10-07

BigCodeArena：通过代码执行端到端评估代码生成质量

推荐理由：提供AI编程模型评测新方法，对AI辅助编程工具开发者有参考价值

BigCodeArena 是一个端到端的代码生成评测框架，通过实际执行生成的代码来评估其正确性与鲁棒性，相比传统基于文本匹配的方法更贴近真实开发场景。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-10-06

Codex is now generally available

推荐理由：涉及AI编程工具Codex的新功能与SDK，契合AI辅助编程主题

OpenAI Codex正式全面上线，新增Slack集成、Codex SDK及管理工具（如用量仪表盘和工作区管理），便于开发者大规模使用和管理。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-10-06

Introducing apps in ChatGPT and the new Apps SDK

推荐理由：涉及AI工具链新SDK发布，契合AI工具库与开发生态主题

OpenAI推出ChatGPT内置应用功能及Apps SDK预览版，开发者可构建可在ChatGPT内直接交互的应用。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-10-06

AMD and OpenAI announce strategic partnership to deploy 6 gigawatts of AMD GPUs

推荐理由：涉及AI基础设施关键硬件合作，影响大模型训练能力

AMD与OpenAI达成多年合作，计划从2026年起部署总计6吉瓦的AMD Instinct GPU，用于支持OpenAI下一代AI基础设施。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-10-06

Introducing AgentKit, new Evals, and RFT for agents

推荐理由：涉及AI智能体开发工具与模型优化技术，契合AI工具库与模型服务主题

Anthropic发布AgentKit、新评估工具和基于强化学习的微调（RFT）功能，帮助开发者加速智能体从原型到生产的落地。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-10-02

With GPT-5, Wrtn builds lifestyle AI for millions in Korea

推荐理由：展示GPT-5在消费级AI产品中的落地应用与规模化案例

韩国公司Wrtn基于GPT-5打造“生活方式AI”，融合生产力、创意与学习功能，已覆盖650万用户，并计划拓展至东亚市场。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-10-02

使用 Core ML 和 dots.ocr 实现最先进的 OCR

推荐理由：涉及热门 AI 工具库在 OCR 场景的应用与部署

文章介绍如何结合 Apple 的 Core ML 与开源 OCR 工具 dots.ocr，构建高性能的光学字符识别系统，并展示了其在移动端部署的优势和实际效果。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-10-01

介绍 RTEB：一种用于检索评估的新标准

推荐理由：涉及AI模型评测新标准，契合模型服务评测兴趣

RTEB 是一个新的检索评估基准，旨在更真实地模拟实际应用场景，涵盖多跳推理、时效性与多模态查询等挑战，提升检索系统评测的实用性。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-09-30

Sora 2 is here

推荐理由：属于AI模型新版本发布及功能评测范畴

OpenAI发布Sora 2视频生成模型，具备更高物理准确性、真实感和可控性，并支持同步对白与音效，现已上线Sora应用。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-09-30

Sora 2 System Card

推荐理由：属于大模型新版本发布及能力评测范畴

Sora 2是OpenAI推出的新型音视频生成模型，相比前代在物理准确性、画面真实感、音画同步、可控性和风格多样性方面有显著提升。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-09-30

Launching Sora responsibly

推荐理由：涉及大模型新版本发布及安全机制，属AI模型发布与评测范畴

OpenAI发布Sora 2视频生成模型及配套应用，强调以安全为核心设计，应对前沿视频模型带来的新型安全挑战。

阅读原文 →

OpenAI Blog ★★★☆☆ 2025-09-29

Empowering teams to unlock insights faster at OpenAI

推荐理由：展示AI在企业数据分析中的实际应用案例

OpenAI推出研究助手，帮助团队快速分析海量客服工单、提取洞察并提升全公司范围内的探索效率。

阅读原文 →

OpenAI Blog ★★★☆☆ 2025-09-29

Building OpenAI with OpenAI

推荐理由：展示AI在企业内部的实际应用与最佳实践

OpenAI推出新系列“OpenAI on OpenAI”，分享如何利用自家AI技术提升工作效率、扩展专业能力并推动成果落地的经验。

阅读原文 →

OpenAI Blog ★★★☆☆ 2025-09-29

Turning contracts into searchable data at OpenAI

推荐理由：展示了AI在企业合同处理中的实际应用案例

OpenAI开发了一套系统，能快速提取合同数据，缩短处理时间并提升团队查询效率。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-09-29

Improving support with every interaction at OpenAI

推荐理由：展示AI在企业服务中的实际应用与效果

OpenAI利用AI优化客户支持，通过自动化和智能系统缩短响应时间、提升服务质量，并支撑业务高速增长。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-09-29

Converting inbound leads into customers at OpenAI

推荐理由：体现AI商业化落地案例，具参考价值

OpenAI利用AI实现大规模个性化回复，高效转化潜在客户为付费用户，展示了AI在销售与客户转化中的实际应用。

阅读原文 →

OpenAI Blog ★★★★☆ 2025-09-29

Buy it in ChatGPT: Instant Checkout and the Agentic Commerce Protocol

推荐理由：涉及AI商业化应用及新交互模式

OpenAI在ChatGPT中推出即时结账功能，探索AI代理与用户、商家协同购物的“代理商务协议”，推动AI在电商场景的商业化落地。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-29

使用深度剪枝草稿模型在英特尔®酷睿™Ultra上加速Qwen3-8B智能体

推荐理由：涉及大模型优化与硬件加速，属AI模型部署实用技术

文章介绍如何通过深度剪枝的草稿模型，在Intel Core Ultra处理器上高效加速Qwen3-8B大模型推理，提升AI智能体运行效率。

阅读原文 →