全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
Hugging Face Blog ★★★★☆ 2024-06-12

Putting RL back in RLHF

推荐理由:涉及大模型训练核心技术,对AI开发者有参考价值

文章探讨如何在RLHF(基于人类反馈的强化学习)中更有效地利用强化学习(RL),提出改进训练稳定性和样本效率的新方法,涉及大模型对齐技术的底层优化。

Hugging Face Blog ★★★★☆ 2024-06-06

推出人工分析文本生成图像排行榜与竞技场

推荐理由:涉及AI模型评测与基准对比,符合用户对AI模型发布及评测的兴趣。

文章介绍了新推出的文本到图像生成模型的排行榜和竞技场平台,用于评估和比较不同AI图像生成模型的性能与质量。

Hugging Face Blog ★★★★☆ 2024-05-29

Benchmarking Text Generation Inference

推荐理由:涉及AI模型推理性能评测,契合用户对模型服务评测的兴趣

文章对多种文本生成推理框架进行了基准测试,评估其在不同模型和硬件上的吞吐量、延迟和资源利用率,为开发者选择高效推理方案提供参考。

Hugging Face Blog ★★★★☆ 2024-05-24

Falcon 2:一个拥有110亿参数的预训练语言模型和视觉语言模型,基于超过5万亿token和11种语言训练

推荐理由:属于AI模型发布及评测范畴,具备技术细节和横向对比价值

Falcon 2 是由 TII 发布的新一代开源大模型,包含11B参数的语言模型和视觉语言模型,训练数据超5万亿token,支持11种语言,性能对标Llama 3.1等主流模型。

Hugging Face Blog ★★★★☆ 2024-05-22

从 Hugging Face 在 AWS Inferentia2 上部署模型

推荐理由:涉及主流 AI 模型部署与推理优化实践,实用性强。

本文介绍如何将 Hugging Face 上的 AI 模型部署到 AWS Inferentia2 芯片上,涵盖优化、推理加速及成本效益分析。

Hugging Face Blog ★★★☆☆ 2024-05-21

使用戴尔企业中心构建本地部署的AI

推荐理由:涉及AI本地化部署的实践方案,契合AI商业化落地场景

文章介绍如何利用Dell Enterprise Hub在本地部署AI基础设施,涵盖硬件配置、软件集成及企业级AI解决方案的实施方法。

Hugging Face Blog ★★★★☆ 2024-05-21

从云到开发者:Hugging Face 与微软深化合作

推荐理由:涉及主流AI平台合作及模型服务落地,契合AI工具与商业化主题

Hugging Face 与微软宣布深化合作,整合 Azure AI 服务与 Hugging Face 平台,为开发者提供更便捷的大模型部署、微调及推理工具,支持开源模型商业化落地。

Hugging Face Blog ★★★★☆ 2024-05-16

通过键值缓存量化实现更长文本生成

推荐理由:涉及大模型推理优化关键技术,提升生成长度与效率

本文介绍了一种通过量化Transformer模型中的键值(KV)缓存来减少内存占用的技术,从而支持更长上下文的文本生成,已在Llama和Mistral等模型上验证有效性。

Hugging Face Blog ★★★★☆ 2024-05-14

推出开源阿拉伯语大语言模型排行榜

推荐理由:涉及大模型评测与多语言AI进展,符合模型评测兴趣点

文章介绍了首个专注于阿拉伯语的开源大语言模型排行榜,涵盖多个模型在语言理解、生成等任务上的基准测试结果,推动阿拉伯语AI生态发展。

Hugging Face Blog ★★★★☆ 2024-05-13

授权调用:Transformers Agents 2.0 发布

推荐理由:涉及热门 AI 工具库更新及编程辅助能力提升

Hugging Face 推出 Transformers Agents 2.0,支持更灵活的工具调用与多模态推理,提升 AI 编程助手在代码生成和任务自动化中的能力。

← 上一页 17 / 34 下一页 →