全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
MIT Tech Review - AI ★★★★☆ 2026-03-31

Shifting to AI model customization is an architectural imperative

推荐理由:契合AI商业化应用与模型定制趋势

文章探讨AI模型定制化的重要性,指出通用模型已成标配,而结合企业专有数据和行业逻辑的定制模型才能构建竞争壁垒,并以Mistral AI为例说明如何实现领域智能。

MIT Tech Review - AI ★★★★☆ 2026-03-31

AI benchmarks are broken. Here’s what we need instead.

推荐理由:探讨AI评测方法论革新,契合模型评测与落地应用主题

文章指出当前AI基准测试脱离真实工作场景,提出应采用HAIC(Human–AI, Context-Specific)新基准,评估AI在人类团队和组织流程中的长期表现。

Hugging Face Blog ★★★★☆ 2026-03-31

跨25个物种训练mRNA语言模型仅需165美元

推荐理由:涉及AI模型训练方法与成本优化,属AI在生物领域的创新应用

研究者提出一种低成本方法,在25个物种上训练mRNA语言模型,总成本仅165美元,展示了高效利用公开基因组数据和开源工具构建生物序列大模型的可行性。

Hugging Face Blog ★★★★☆ 2026-03-31

TRL v1.0:一个为随领域演进而生的后训练库

推荐理由:推荐热门AI训练工具库,适合开发者跟进前沿微调技术

TRL(Transformer Reinforcement Learning)v1.0 是一个用于大模型后训练的开源库,支持PPO、DPO等算法,旨在灵活适配快速发展的AI对齐与微调技术。

MIT Tech Review - AI ★★★★☆ 2026-03-30

There are more AI health tools than ever—but how well do they work?

推荐理由:聚焦AI在医疗行业的落地应用与评估挑战,符合AI商业化应用主题。

文章探讨了Copilot Health、Amazon Health AI等AI健康工具的兴起,强调其在医疗资源不足背景下的潜力,同时指出缺乏独立评估和透明验证机制的问题,并呼吁建立第三方基准测试以确保安全性和有效性。

LangChain Blog ★★★★☆ 2026-03-27

Agent Evaluation Readiness Checklist

推荐理由:涉及AI Agent评估方法论及LangChain工具链,契合AI模型评测与工具库推荐主题

本文提供了一份实用的Agent评估准备清单,指导开发者如何构建、运行和部署AI Agent的评估流程,涵盖从基础端到端测试到复杂评估策略的逐步方法,并推荐了LangChain生态中的相关工具。

LangChain Blog ★★★★☆ 2026-03-26

How Kensho built a multi-agent framework with LangGraph to solve trusted financial data retrieval

推荐理由:展示了AI多智能体框架在金融数据检索中的落地应用及技术实现

Kensho基于LangGraph构建多智能体框架Grounding,用于在金融领域实现高可信度的数据检索,整合S&P Global多业务单元结构化数据,并通过路由评估和协议优化提升系统准确性与效率。

LangChain Blog ★★★★☆ 2026-03-26

How we build evals for Deep Agents

推荐理由:涉及AI智能体评测方法论与开源工具,契合AI模型评测与工具库推荐主题。

文章介绍了如何为Deep Agents构建评估体系,强调通过有针对性的评测指标来引导和优化AI智能体行为,并开源了相关实现。

LangChain Blog ★★★★☆ 2026-03-26

How Middleware Lets You Customize Your Agent Harness

推荐理由:涉及AI开发工具链中的关键组件定制,契合AI编程工具与开源库兴趣方向

文章介绍如何通过“Agent Middleware”在LangChain和Deep Agent基础上定制化智能体框架,满足不同应用场景需求,并提升代码复用与模块解耦。

Google AI Blog ★★★★☆ 2026-03-25

Build with Lyria 3, our newest music generation model

推荐理由:涉及AI模型发布及使用方式,符合用户对AI模型/服务发布的关注。

Google发布最新音乐生成模型Lyria 3,现已通过Gemini API提供付费预览,并可在Google AI Studio中测试。

MIT Tech Review - AI ★★★☆☆ 2026-03-25

This startup wants to change how mathematicians do math

推荐理由:涉及AI辅助科研工具及开源项目,契合AI工具库与应用主题

Axiom Math发布开源AI工具Axplorer,帮助数学家发现数学规律,基于此前Meta开发的PatternBoost,现可在普通电脑运行,支持探索性数学研究。

OpenAI Blog ★★★☆☆ 2026-03-25

Inside our approach to the Model Spec

推荐理由:涉及大模型行为规范与安全机制,属AI模型服务的重要设计原则

OpenAI发布Model Spec,作为公开框架指导模型行为,在安全性、用户自由与问责之间取得平衡,适用于AI系统演进中的行为规范。

OpenAI Blog ★★★☆☆ 2026-03-25

Introducing the OpenAI Safety Bug Bounty program

推荐理由:涉及AI系统安全性,与AI模型服务的实际应用风险相关

OpenAI推出安全漏洞赏金计划,鼓励发现AI滥用和安全风险,如代理漏洞、提示注入和数据泄露等问题。

← 上一页 14 / 81 下一页 →