全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
Hugging Face Blog ★★★★☆ 2025-02-04

DABStep:面向多步推理的数据智能体基准测试

推荐理由:提供 AI 智能体多步推理能力的评测标准,契合模型评测兴趣点

DABStep 是一个评估 AI 智能体在多步推理任务中处理真实世界数据能力的新基准,涵盖数据理解、转换与分析等复杂操作。

Hugging Face Blog ★★★★☆ 2025-02-02

Open-R1:更新 #1

推荐理由:涉及新开源AI模型发布与评测,符合用户兴趣

Open-R1 首次更新介绍了其开源推理模型的最新进展,包括性能优化、新功能支持及基准测试结果,对标闭源大模型表现。

Hugging Face Blog ★★★★☆ 2025-01-31

Mini-R1:复现 Deepseek R1 的「顿悟时刻」强化学习教程

推荐理由:结合热门大模型现象与RL技术实践,适合AI开发者学习

本文通过简化版 Mini-R1 模型,复现了 Deepseek R1 在训练中出现的“顿悟时刻”现象,并提供了一个可复现的强化学习(RL)教程,帮助开发者理解大模型能力突现的机制。

Hugging Face Blog ★★★★☆ 2025-01-30

如何在 AWS 上部署和微调 DeepSeek 模型

推荐理由:涵盖主流大模型的部署与微调实操,适合开发者参考

本文详细介绍了在 AWS 平台上部署和微调 DeepSeek 大模型的完整流程,包括环境配置、训练脚本优化及推理服务搭建。

Hugging Face Blog ★★★★☆ 2025-01-28

欢迎使用 Hub 上的推理提供商 🔥

推荐理由:介绍热门 AI 平台新功能,便于开发者快速接入大模型服务。

Hugging Face Hub 推出 Inference Providers 功能,允许用户直接通过 Hub 调用多家服务商的大模型 API,简化 AI 模型部署与调用流程。

Hugging Face Blog ★★★★☆ 2025-01-28

Open-R1:DeepSeek-R1 的完全开源复现

推荐理由:涉及大模型开源复现与技术细节,符合AI模型发布及评测兴趣

Open-R1 是对 DeepSeek-R1 模型的完全开源复现,包含训练数据、代码和模型权重,旨在推动透明、可复现的大模型研究。

Hugging Face Blog ★★★★☆ 2025-01-27

Diffusers 中开源视频生成模型的现状

推荐理由:涵盖热门 AI 视频生成模型及开源工具库使用,符合工具与模型评测兴趣

文章介绍了 Hugging Face Diffusers 库中当前支持的开源视频生成模型,包括 SVD、CogVideoX 等,并对比其性能、使用方式及生成效果。

Hugging Face Blog ★★★★☆ 2025-01-23

使用 KVPress 掌握大语言模型中的长上下文处理

推荐理由:涉及大模型关键技术优化,属热门AI工具库方向

本文介绍 KVPress,一种提升大语言模型处理长上下文效率的新方法,通过压缩键值缓存减少计算开销,在保持性能的同时显著提升推理速度。

Hugging Face Blog ★★★★☆ 2025-01-22

Hugging Face 与 FriendliAI 合作加速模型在 Hub 上的部署

推荐理由:涉及主流 AI 模型服务平台与推理优化工具的集成,对开发者部署模型有实用价值。

Hugging Face 与 FriendliAI 合作,通过集成 FriendliAI 的推理优化技术,显著提升 Hugging Face Hub 上模型的部署速度和性能,支持更快、更高效的 AI 模型服务。

Hugging Face Blog ★★★★☆ 2025-01-13

AI 智能体来了,接下来怎么办?

推荐理由:深入解析AI智能体技术与落地场景,契合AI商业化与工具趋势

文章探讨了当前AI智能体(AI Agents)的发展现状、核心能力及其在实际应用中的潜力,涵盖主流框架、典型产品案例及未来挑战。

Hugging Face Blog ★★★★☆ 2024-12-31

介绍 smolagents:用代码编写动作的轻量级智能体

推荐理由:推荐热门开源 AI 智能体框架,契合 AI 编程与工具库兴趣

Hugging Face 推出 smolagents,一个轻量级 AI 智能体框架,允许代理直接用 Python 编写并执行动作代码,支持工具调用、搜索和模型间通信,适用于快速构建可编程 AI 应用。

Hugging Face Blog ★★★★☆ 2024-12-23

使用 NVIDIA 的 LogitsProcessorZoo 控制语言模型生成

推荐理由:介绍实用的AI模型控制工具,提升生成质量与可控性

NVIDIA 推出 LogitsProcessorZoo,提供多种 logits 处理器用于精细控制大模型文本生成行为,如限制输出格式、引导内容方向等,适用于推理优化与可控生成场景。

Hugging Face Blog ★★★★☆ 2024-12-20

Evaluating Audio Reasoning with Big Bench Audio

推荐理由:涉及AI模型音频推理能力评测,符合模型评测兴趣点

Big Bench Audio 是一个评估大模型音频推理能力的新基准,涵盖语音理解、声学场景分析等任务,旨在推动多模态AI在音频领域的进展。

← 上一页 12 / 34 下一页 →