全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
Hugging Face Blog ★★★★☆ 2024-12-19

终于有了BERT的替代者:ModernBERT登场

推荐理由:涉及新AI模型发布及性能评测,契合用户对模型更新的关注

文章介绍了新发布的ModernBERT模型,作为BERT的现代替代方案,在多项基准测试中表现更优,训练数据更新、架构更高效。

Hugging Face Blog ★★★★☆ 2024-12-18

Bamba:推理高效的混合 Mamba2 模型

推荐理由:涉及新型高效AI模型架构,属模型发布与评测范畴

Bamba 是一种结合 Mamba2 与注意力机制的混合架构,在保持性能的同时显著提升推理效率,适用于资源受限场景。

Hugging Face Blog ★★★★★ 2024-12-17

欢迎来到 Falcon 3 开源模型家族!

推荐理由:重磅开源模型发布,支持商用,适合开发者部署和研究

阿布扎比AI公司推出Falcon 3系列开源大模型,包含多个规模版本,在推理、编码和多语言任务上表现优异,并全面开放权重与商用许可。

Hugging Face Blog ★★★★☆ 2024-12-09

Hugging Face 模型上线 Amazon Bedrock

推荐理由:涉及主流AI模型平台集成与云服务落地,具实用参考价值

Amazon Bedrock 现已支持 Hugging Face 的多个开源大模型,用户可通过托管服务直接调用这些模型进行推理,简化了部署流程并提升开发效率。

Hugging Face Blog ★★★★☆ 2024-12-04

用3C3H重新思考大语言模型评估:AraGen基准与排行榜

推荐理由:涉及大模型评测新方法与基准测试,符合AI模型评测兴趣方向

文章提出基于3C3H框架(Correctness, Coherence, Consistency, Helpfulness, Harmlessness, Hallucination)的AraGen基准,用于更全面评估大语言模型在阿拉伯语等多语言场景下的性能,并发布相应排行榜。

Hugging Face Blog ★★★★☆ 2024-11-26

Rearchitecting Hugging Face Uploads and Downloads

推荐理由:涉及热门 AI 工具库 Hugging Face 的核心功能优化,对开发者有实用价值。

Hugging Face 重构其模型和数据集的上传下载系统,提升稳定性、速度与可扩展性,引入分块上传、断点续传及更高效的 CDN 集成。

Hugging Face Blog ★★★★☆ 2024-11-26

SmolVLM - 小而强大的视觉语言模型

推荐理由:推荐轻量级多模态模型,适合边缘部署和高效应用

SmolVLM 是一个轻量级但性能出色的视觉语言模型,适合资源受限环境部署,在多项基准测试中表现优异。

Hugging Face Blog ★★★★☆ 2024-11-25

你本可以设计出最先进的位置编码

推荐理由:详解AI大模型核心技术——位置编码,具实践指导价值

文章深入讲解了大模型中位置编码(如RoPE)的设计原理,从基础概念到前沿变体,帮助读者理解并可能自行设计更优的位置编码方法。

Hugging Face Blog ★★★★☆ 2024-11-20

让大模型辩论:首届多语言大模型辩论赛

推荐理由:涉及大模型能力评测与多语言性能对比,契合模型评测兴趣点

文章介绍首届多语言大模型辩论竞赛,评估不同大模型在逻辑推理、语言表达和跨文化辩论中的表现,涵盖多种语言和模型架构。

Hugging Face Blog ★★★★☆ 2024-11-20

使用自推测解码实现更快的文本生成

推荐理由:涉及大模型推理优化技术,属AI模型服务性能提升范畴

论文提出一种名为“自推测解码”(Self-Speculative Decoding)的新方法,通过模型自身生成草稿并验证,显著加速文本生成过程,无需额外小模型,在多个基准上提升推理速度。

Hugging Face Blog ★★★★☆ 2024-11-20

推出日本大语言模型开放排行榜!

推荐理由:涉及大模型评测与基准对比,符合用户对AI模型发布及评测的兴趣。

文章介绍了首个面向日本大语言模型的开放排行榜,涵盖多种日语任务基准测试,旨在推动本地化模型性能透明化与竞争。

Hugging Face Blog ★★★★☆ 2024-11-19

Judge Arena:将大语言模型作为评估者的基准测试

推荐理由:涉及大模型评测新方法,契合AI模型评测兴趣点

Judge Arena 是一个用于评估大语言模型(LLM)作为自动评估器性能的基准平台,通过对比不同模型在评分质量、一致性与人类判断对齐度等方面的表现,推动 LLM 评估能力的标准化。

← 上一页 13 / 34 下一页 →