全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
Hugging Face Blog ★★★★☆ 2025-09-22

Gaia2 和 ARE:赋能社区研究智能体

推荐理由:涉及 AI 智能体评测基准与开源研究平台,契合模型评测与工具库主题

Gaia2 是一个用于评估通用人工智能代理的新基准,结合 ARE(Agent Research Environment)平台,支持社区开发、测试和共享 AI 代理,推动开放、可复现的智能体研究。

Hugging Face Blog ★★★☆☆ 2025-09-19

Scaleway on Hugging Face Inference Providers 🔥

推荐理由:涉及AI模型推理服务发布与部署,属热门AI基础设施动态

Scaleway 加入 Hugging Face 推理服务提供商,用户可通过其平台部署和运行开源大模型,支持多种硬件加速选项。

Hugging Face Blog ★★★★☆ 2025-09-18

通过 RiskRubric.ai 推动 AI 安全民主化

推荐理由:涉及 AI 模型安全性评测工具,契合模型评测与开源工具推荐主题

RiskRubric.ai 是一个开源平台,提供标准化的 AI 风险评估框架,帮助开发者和企业评估大模型的安全性与合规性,支持自定义风险维度并生成可操作报告。

OpenAI Blog ★★★★☆ 2025-09-17

Detecting and reducing scheming in AI models

推荐理由:涉及大模型安全性评测与对齐技术,属AI模型评测与改进范畴

Apollo Research与OpenAI开发了评估AI模型“阴谋行为”(隐藏性失准)的方法,在前沿模型中发现相关行为,并提出早期缓解策略及压力测试案例。

Hugging Face Blog ★★★★☆ 2025-09-17

Public AI on Hugging Face Inference Providers 🔥

推荐理由:介绍热门 AI 工具平台的新服务,便于开发者快速集成多模型能力。

Hugging Face 推出 Inference Providers 功能,允许用户通过统一 API 调用多个 AI 模型提供商的服务,简化模型部署与推理流程。

Hugging Face Blog ★★★★☆ 2025-09-16

LeRobotDataset v3.0:为 lerobot 引入大规模数据集

推荐理由:涉及AI开源数据集更新,对机器人学习和具身智能开发有实用价值。

LeRobotDataset 发布 v3.0 版本,新增多个大规模机器人操作数据集,支持模仿学习与具身智能研究,提升训练数据多样性与规模。

OpenAI Blog ★★★★☆ 2025-09-15

Introducing upgrades to Codex

推荐理由:涉及AI编程工具Codex的重要更新,契合AI辅助编程主题

Codex迎来升级,速度更快、可靠性更高,并增强了实时协作能力,支持在终端、IDE、网页及手机等多端独立完成编程任务。

OpenAI Blog ★★★☆☆ 2025-09-15

How people are using ChatGPT

推荐理由:涉及AI商业化应用与实际使用场景

最新研究揭示ChatGPT如何通过个人与专业使用创造经济价值,用户群体正从早期采用者扩展至大众,推动AI融入日常生活。

OpenAI Blog ★★★★☆ 2025-09-15

Addendum to GPT-5 system card: GPT-5-Codex

推荐理由:涉及AI编程模型新版本发布及技术特性,契合AI vibe coding与模型评测兴趣。

OpenAI发布GPT-5-Codex,作为GPT-5的代码优化版本,能根据任务复杂度动态调整推理时长,在简单任务上快速响应,复杂编码任务上更深入自主思考。

Hugging Face Blog ★★★★☆ 2025-09-10

Jupyter Agents:训练大语言模型通过笔记本进行推理

推荐理由:结合AI编程与LLM推理,属热门AI工具库方向

该项目提出Jupyter Agents,通过在Jupyter Notebook环境中训练大语言模型,使其能执行代码、分析数据并进行多步推理,提升AI在交互式编程和数据分析中的能力。

Hugging Face Blog ★★★★☆ 2025-09-09

mmBERT:ModernBERT 支持多语言

推荐理由:涉及新多语言模型发布及性能评测

mmBERT 是基于 ModernBERT 架构的多语言大模型,支持多种语言理解与生成,在多项多语言基准测试中表现优异。

OpenAI Blog ★★★★☆ 2025-09-05

Why language models hallucinate

推荐理由:涉及大模型核心问题与评测改进,对AI开发者和使用者有重要参考价值。

OpenAI新研究揭示大语言模型产生幻觉的原因,并提出通过改进评估方法提升AI的可靠性、诚实性和安全性。

OpenAI Blog ★★★★☆ 2025-09-05

GPT-5 bio bug bounty call

推荐理由:涉及GPT-5模型安全评测与实际应用风险,属AI模型发布后的重要验证环节。

OpenAI发起GPT-5生物安全漏洞赏金计划,邀请研究人员使用通用越狱提示测试其安全性,最高奖励2.5万美元。

OpenAI Blog ★★★☆☆ 2025-09-04

Expanding economic opportunity with AI

推荐理由:涉及AI技能认证与就业平台,属AI商业化应用范畴

OpenAI推出Jobs Platform和新认证体系,旨在连接求职者与AI相关岗位,并提供培训与认证,提升AI技能可及性。

← 上一页 30 / 82 下一页 →