全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
Hugging Face Blog ★★★★☆ 2024-12-04

用3C3H重新思考大语言模型评估:AraGen基准与排行榜

推荐理由:涉及大模型评测新方法与基准测试,符合AI模型评测兴趣方向

文章提出基于3C3H框架(Correctness, Coherence, Consistency, Helpfulness, Harmlessness, Hallucination)的AraGen基准,用于更全面评估大语言模型在阿拉伯语等多语言场景下的性能,并发布相应排行榜。

Lilian Weng's Blog ★★★★☆ 2024-11-28

Reward Hacking in Reinforcement Learning

推荐理由:涉及AI对齐与模型安全,影响AI产品落地可靠性

文章探讨强化学习中的奖励黑客问题,即智能体利用奖励函数漏洞获取高分却未完成真实任务。随着语言模型通过RLHF对齐训练广泛应用,该问题在AI模型自主应用中成为关键挑战。

Hugging Face Blog ★★★★☆ 2024-11-26

Rearchitecting Hugging Face Uploads and Downloads

推荐理由:涉及热门 AI 工具库 Hugging Face 的核心功能优化,对开发者有实用价值。

Hugging Face 重构其模型和数据集的上传下载系统,提升稳定性、速度与可扩展性,引入分块上传、断点续传及更高效的 CDN 集成。

Hugging Face Blog ★★★★☆ 2024-11-26

SmolVLM - 小而强大的视觉语言模型

推荐理由:推荐轻量级多模态模型,适合边缘部署和高效应用

SmolVLM 是一个轻量级但性能出色的视觉语言模型,适合资源受限环境部署,在多项基准测试中表现优异。

Hugging Face Blog ★★★★☆ 2024-11-25

你本可以设计出最先进的位置编码

推荐理由:详解AI大模型核心技术——位置编码,具实践指导价值

文章深入讲解了大模型中位置编码(如RoPE)的设计原理,从基础概念到前沿变体,帮助读者理解并可能自行设计更优的位置编码方法。

OpenAI Blog ★★★☆☆ 2024-11-21

Empowering a global org with ChatGPT

推荐理由:涉及AI在企业中的实际应用与落地,符合AI商业化主题。

文章探讨如何在全球性组织中部署和应用ChatGPT,提升工作效率与协作能力,涵盖实际落地场景与实施策略。

OpenAI Blog ★★★★☆ 2024-11-20

Building smarter maps with GPT-4o vision fine-tuning

推荐理由:涉及大模型视觉能力微调及实际应用,契合AI模型应用与工具使用主题

文章介绍如何通过微调GPT-4o的视觉能力来构建更智能的地图系统,提升地图对图像数据的理解与结构化输出能力。

Hugging Face Blog ★★★★☆ 2024-11-20

让大模型辩论:首届多语言大模型辩论赛

推荐理由:涉及大模型能力评测与多语言性能对比,契合模型评测兴趣点

文章介绍首届多语言大模型辩论竞赛,评估不同大模型在逻辑推理、语言表达和跨文化辩论中的表现,涵盖多种语言和模型架构。

Hugging Face Blog ★★★★☆ 2024-11-20

使用自推测解码实现更快的文本生成

推荐理由:涉及大模型推理优化技术,属AI模型服务性能提升范畴

论文提出一种名为“自推测解码”(Self-Speculative Decoding)的新方法,通过模型自身生成草稿并验证,显著加速文本生成过程,无需额外小模型,在多个基准上提升推理速度。

Hugging Face Blog ★★★★☆ 2024-11-20

推出日本大语言模型开放排行榜!

推荐理由:涉及大模型评测与基准对比,符合用户对AI模型发布及评测的兴趣。

文章介绍了首个面向日本大语言模型的开放排行榜,涵盖多种日语任务基准测试,旨在推动本地化模型性能透明化与竞争。

OpenAI Blog ★★★☆☆ 2024-11-19

Rox goes “all in” on OpenAI

推荐理由:涉及AI商业化应用及大模型落地案例

Rox宣布全面采用OpenAI模型,结合其商业经验与大语言模型技术,旨在赋能销售人员成为顶尖销售。

Hugging Face Blog ★★★★☆ 2024-11-19

Judge Arena:将大语言模型作为评估者的基准测试

推荐理由:涉及大模型评测新方法,契合AI模型评测兴趣点

Judge Arena 是一个用于评估大语言模型(LLM)作为自动评估器性能的基准平台,通过对比不同模型在评分质量、一致性与人类判断对齐度等方面的表现,推动 LLM 评估能力的标准化。

OpenAI Blog ★★★☆☆ 2024-11-13

Data-driven beauty and creativity with ChatGPT

推荐理由:展示AI在美妆行业的商业化落地案例

雅诗兰黛公司利用ChatGPT挖掘数据洞察,驱动美妆产品创新与消费者体验优化,展示了AI在消费品行业的实际应用。

Hugging Face Blog ★★★★☆ 2024-11-05

Hugging Face + PyCharm

推荐理由:结合热门 AI 工具库与主流 IDE,提升开发体验

Hugging Face 与 PyCharm 集成,支持在 IDE 中直接使用 Transformers、Datasets 等库,提升 AI 模型开发效率。

OpenAI Blog ★★★★☆ 2024-10-31

Introducing ChatGPT search

推荐理由:涉及AI模型新功能发布,属核心兴趣领域

OpenAI推出ChatGPT搜索功能,可快速提供附带相关网页链接的及时答案,增强信息溯源与实时性。

← 上一页 49 / 88 下一页 →