全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
Hugging Face Blog ★★★★☆ 2025-09-10

Jupyter Agents:训练大语言模型通过笔记本进行推理

推荐理由:结合AI编程与LLM推理,属热门AI工具库方向

该项目提出Jupyter Agents,通过在Jupyter Notebook环境中训练大语言模型,使其能执行代码、分析数据并进行多步推理,提升AI在交互式编程和数据分析中的能力。

Hugging Face Blog ★★★★☆ 2025-09-09

mmBERT:ModernBERT 支持多语言

推荐理由:涉及新多语言模型发布及性能评测

mmBERT 是基于 ModernBERT 架构的多语言大模型,支持多种语言理解与生成,在多项多语言基准测试中表现优异。

Hugging Face Blog ★★★★☆ 2025-09-02

SAIR:利用AI驱动的结构智能加速制药研发

推荐理由:展示了AI在制药行业的具体落地应用和商业价值

SAIR是一家利用AI结构智能技术加速药物研发的公司,其平台通过分析蛋白质结构与相互作用,提升新药发现效率,已在多个制药合作项目中验证效果。

Hugging Face Blog ★★★★☆ 2025-08-20

NVIDIA 发布600万规模多语言推理数据集

推荐理由:该数据集对训练和评测多语言AI模型具有重要价值,属于AI模型基础设施资源。

NVIDIA开源了一个包含600万条样本的多语言推理数据集,涵盖多种语言和复杂推理任务,旨在推动大模型在多语言理解和逻辑推理能力上的发展。

Hugging Face Blog ★★★★☆ 2025-08-19

使用 Claude 和 Hugging Face 生成图像

推荐理由:展示了主流AI工具链在图像生成中的协同应用

本文介绍如何结合 Anthropic 的 Claude 模型与 Hugging Face 平台生成图像,涵盖 API 调用、提示工程及开源模型集成方法。

Hugging Face Blog ★★★★☆ 2025-08-18

从零到GPU:构建和扩展生产级CUDA内核指南

推荐理由:涉及AI底层加速技术,对理解大模型推理优化有实用价值。

本文深入讲解如何从零开始编写、优化并部署高性能CUDA内核,涵盖内存管理、并行策略及在AI模型推理中的实际应用。

Hugging Face Blog ★★★★☆ 2025-08-18

用于研究的MCP:如何将AI连接到研究工具

推荐理由:聚焦MCP在科研场景的实用集成技巧,契合AI工具库及skill推荐主题

本文介绍如何使用MCP(Model Context Protocol)将AI模型与各类科研工具(如文献管理、数据分析、实验平台)集成,提升研究效率,并提供具体连接方法和示例。

Hugging Face Blog ★★★★☆ 2025-08-14

Kimina-Prover-RL

推荐理由:涉及AI模型在形式化验证领域的创新应用与开源工具

Kimina-Prover-RL 是一个基于强化学习的自动定理证明器,结合大语言模型与形式化验证技术,旨在提升AI在数学推理和代码正确性验证中的能力。项目开源并提供训练框架与基准测试。

Hugging Face Blog ★★★★☆ 2025-08-13

Arm 与 ExecuTorch 0.7:将生成式 AI 带给大众

推荐理由:涉及热门 AI 工具库 ExecuTorch 的新版本及边缘 AI 部署方案

Arm 联合 Meta 推出 ExecuTorch 0.7,优化生成式 AI 模型在移动端和边缘设备的部署,提升推理效率与能效,降低 AI 应用门槛。

Hugging Face Blog ★★★☆☆ 2025-08-12

TextQuests: How Good are LLMs at Text-Based Video Games?

推荐理由:评测LLM在交互式文本环境中的推理与记忆能力

论文《TextQuests》评估了大语言模型(LLMs)在纯文本视频游戏中的表现,测试其理解复杂叙事、记忆状态和规划能力,并与人类玩家对比。

Hugging Face Blog ★★★★☆ 2025-08-08

加速 ND-Parallel:高效多 GPU 训练指南

推荐理由:涉及AI模型训练优化,属热门AI工具库与训练技巧

本文介绍 ND-Parallel 技术,通过在多个 GPU 上并行化模型的不同维度(如数据、张量、流水线),显著提升大模型训练效率,并提供实践配置示例。

Hugging Face Blog ★★★★☆ 2025-08-07

Vision Language Model Alignment in TRL ⚡️

推荐理由:介绍热门AI工具库TRL的新功能,涉及多模态模型对齐技术

TRL库新增视觉语言模型对齐支持,提供多模态RLHF训练工具,适用于Llama-3.2、Phi-3.5等开源模型。

Hugging Face Blog ★★★★☆ 2025-08-04

在 DeepResearch 基准上评测开源 Llama Nemotron 模型

推荐理由:涉及大模型评测与基准测试,符合用户对AI模型发布及评测的兴趣。

文章评估了开源的 Llama Nemotron 系列模型在 DeepResearch 基准上的表现,涵盖推理、代码生成和多跳问答等维度,并与同类模型进行对比。

← 上一页 6 / 34 下一页 →