全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
Hugging Face Blog ★★★★☆ 2024-07-25

LAVE:基于LLM在Docmatix上进行零样本视觉问答评估——我们还需要微调吗?

推荐理由:涉及大模型零样本能力与评测,契合AI模型评测主题

论文提出LAVE方法,利用大语言模型在Docmatix数据集上实现零样本视觉问答(VQA)评估,探讨是否仍需微调。实验表明,先进提示策略可显著提升零样本性能,挑战传统微调必要性。

Hugging Face Blog ★★★★☆ 2024-07-22

WWDC 24:使用 Core ML 运行 Mistral 7B

推荐理由:涉及大模型本地部署与性能优化,属热门AI工具链实践

苹果在 WWDC 24 上展示了如何通过 Core ML 在本地设备高效运行 Mistral 7B 开源大模型,涵盖模型转换、优化及推理性能。

OpenAI Blog ★★★★☆ 2024-07-18

GPT-4o mini: advancing cost-efficient intelligence

推荐理由:新模型发布及性能成本评测,契合AI模型服务更新主题

OpenAI发布GPT-4o mini,作为GPT-3.5 Turbo的继任者,具备更低延迟、更强多模态能力及显著成本优势(输入$0.15/百万token,输出$0.6/百万token),已在API和ChatGPT中上线。

OpenAI Blog ★★★★☆ 2024-07-18

New compliance and administrative tools for ChatGPT Enterprise

推荐理由:涉及AI服务的企业级功能发布与安全管理,契合AI商业化应用与服务评测主题。

OpenAI为ChatGPT Enterprise推出合规与管理新工具,包括合规API集成、SCIM用户管理及GPT使用控制,强化企业级数据安全与访问管控。

Hugging Face Blog ★★★★☆ 2024-07-18

TGI Multi-LoRA:一次部署,服务30个模型

推荐理由:介绍热门AI推理框架新特性,实用性强

Hugging Face 推出 TGI Multi-LoRA 功能,允许在单个 Text Generation Inference 实例上同时托管多达30个 LoRA 微调模型,显著降低部署成本并提升推理效率。

Hugging Face Blog ★★★★☆ 2024-07-16

SmolLM——极速且强大的小型语言模型

推荐理由:热门开源AI模型发布及评测,符合工具库与模型评测兴趣

Hugging Face发布SmolLM系列开源小模型,在多项基准测试中表现优异,兼顾推理速度与性能,适合本地和边缘设备部署。

Hugging Face Blog ★★★★☆ 2024-07-11

NuminaMath 如何赢得首届 AIMO 进步奖

推荐理由:涉及 AI 模型在专业领域的性能突破与评测

NuminaMath 凭借其在 AI 数学推理领域的创新方法,赢得了首届 AIMO(AI for Math Olympiad)进步奖,展示了专用模型在复杂数学问题求解上的突破。

Hugging Face Blog ★★★★☆ 2024-07-10

宣布 Hugging Face 与 KerasHub 的新集成

推荐理由:热门 AI 工具库整合,提升开发效率

Hugging Face 与 KerasHub 集成,使 TensorFlow/Keras 用户能直接加载和使用 Hugging Face Hub 上的模型,简化 AI 模型调用流程。

Hugging Face Blog ★★★☆☆ 2024-07-10

使用 Presidio 在 Hugging Face Hub 上实验自动 PII 检测

推荐理由:涉及热门AI工具Presidio在数据处理中的实际应用,契合AI工具库推荐主题。

文章介绍如何利用开源工具 Presidio 在 Hugging Face Hub 上自动检测数据集中的个人身份信息(PII),提升数据隐私与合规性。

Hugging Face Blog ★★★★☆ 2024-07-09

Google Cloud TPU 向 Hugging Face 用户开放

推荐理由:涉及AI基础设施与主流平台集成,对模型训练效率提升有实际价值

Google Cloud 宣布其TPU(张量处理单元)现已向Hugging Face用户开放,便于开发者更高效地训练和部署AI模型,尤其适用于大模型场景。

Lilian Weng's Blog ★★★☆☆ 2024-07-07

Extrinsic Hallucinations in LLMs

推荐理由:涉及AI模型可靠性与事实一致性,属模型评测与改进范畴

文章探讨大语言模型中的外源性幻觉问题,即模型输出缺乏外部世界知识支撑的现象,并强调模型应具备事实准确性及对未知问题的诚实回应能力。

Hugging Face Blog ★★★★☆ 2024-07-03

在 Intel Gaudi 2 上加速蛋白质语言模型 ProtST

推荐理由:涉及 AI 模型在专用硬件上的性能评测与优化,属 AI 模型服务发布及评测范畴。

文章介绍如何在 Intel Gaudi 2 硬件上优化和加速蛋白质语言模型 ProtST 的推理与训练,涵盖性能调优技巧和基准测试结果。

← 上一页 54 / 89 下一页 →