全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
OpenAI Blog ★★★☆☆ 2016-08-29

Infrastructure for deep learning

推荐理由:涉及AI开发基础设施,与AI工具链和工程实践相关

文章探讨深度学习基础设施的重要性,并指出当前开源生态让构建优质深度学习基础设施变得可行。

OpenAI Blog ★★★★☆ 2016-06-21

Concrete AI safety problems

推荐理由:聚焦AI系统安全性,属AI模型可靠性与落地应用基础问题

Google Brain联合多所高校发布《AI安全中的具体问题》论文,探讨确保现代机器学习系统按预期运行的关键研究问题。

OpenAI Blog ★★★☆☆ 2016-06-16

Generative models

推荐理由:涉及生成模型核心技术与应用,符合AI模型发布及评测主题

文章介绍生成模型的基本概念、重要性及四个相关项目,涵盖其在无监督学习中的应用与发展方向。

OpenAI Blog ★★★★☆ 2016-04-27

OpenAI Gym Beta

推荐理由:热门AI开源工具库,适合RL开发者使用

OpenAI发布Gym公开测试版,提供强化学习算法开发与对比的工具包,包含多种模拟环境和结果复现平台。

HackerNews Best ★★★☆☆

Claude mixes up who said what

推荐理由:涉及大模型实际表现问题,属于AI模型评测范畴

文章指出Claude在对话中混淆了用户与自身发言内容,导致逻辑混乱,影响用户体验。作者通过具体案例展示了该问题,并讨论了其对AI助手可靠性的潜在影响。

HackerNews Best ★★★★☆

Muse Spark: Scaling towards personal superintelligence

推荐理由:涉及大模型新架构及AI个人智能应用,属前沿技术发布

Meta发布Muse Spark,一个面向个人超级智能的多模态AI系统,支持文本、图像生成与推理,并引入模块化设计以提升可扩展性与个性化能力。

HackerNews Best ★★★★☆

Reallocating $100/Month Claude Code Spend to Zed and OpenRouter

推荐理由:涉及AI编程工具使用与成本优化,贴合AI vibe coding主题

作者将每月100美元的Claude代码辅助支出转向Zed编辑器和OpenRouter,探索更经济高效的AI编程方案,对比不同工具在代码生成、响应速度和成本上的表现。

HackerNews Best ★★★★☆

Exploiting the most prominent AI agent benchmarks

推荐理由:涉及AI模型评测与基准测试,契合用户关注点

文章探讨当前主流AI智能体基准测试的局限性,并提出构建更可信、贴近真实应用场景的评测体系,以推动AI代理技术的可靠发展。

HackerNews Best ★★★☆☆

GitHub Stacked PRs

推荐理由:提升AI辅助编程中的代码协作体验

GitHub 推出 Stacked PRs 功能,支持开发者创建依赖链式的 Pull Request,提升代码审查与协作效率,尤其适合复杂功能开发。

HackerNews Best ★★★★☆

我在 Codex CLI 中本地运行了 Gemma 4 模型

推荐理由:涉及新模型本地部署及AI编程工具使用

作者在 Codex CLI 工具中成功本地部署并运行了 Google 新发布的 Gemma 4 模型,展示了其在本地开发环境中的使用方法和初步体验。

HackerNews Best ★★★★☆

Claude 代码例程

推荐理由:介绍 Claude 新增的 AI 编程功能,契合 AI vibe coding 主题。

Anthropic 推出 Claude Code Routines 功能,允许用户通过自然语言创建可复用的代码片段,并在 IDE 中调用,提升 AI 辅助编程效率。

HackerNews Best ★★★★☆

内省扩散语言模型

推荐理由:涉及新AI模型架构及性能评测,符合模型发布与评测兴趣

提出一种新型扩散语言模型,通过内省机制改进生成质量,在多个基准上表现优异。

← 上一页 87 / 90 下一页 →