全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
OpenAI Blog ★★★★☆ 2021-03-04

Multimodal neurons in artificial neural networks

推荐理由:揭示AI模型内部机制,对理解多模态模型有重要价值

研究发现CLIP模型中存在多模态神经元,能对同一概念的不同表现形式(如字面、符号或抽象)作出响应,有助于解释其强大的图像分类能力,并揭示模型学到的关联与偏见。

Hugging Face Blog ★★★★☆ 2021-02-09

Hugging Face on PyTorch / XLA TPUs

推荐理由:涉及热门AI工具库与硬件加速实践

Hugging Face 官方博客介绍了如何在 PyTorch/XLA 上使用 TPU 进行高效训练,涵盖环境配置、代码适配及性能优化技巧。

Hugging Face Blog ★★★★☆ 2021-01-26

Hugging Face Transformers 中更快的 TensorFlow 模型

推荐理由:涉及热门 AI 工具库的性能升级,对开发者有实用价值

Hugging Face Transformers 库新增对 TensorFlow 模型的性能优化,提升推理速度并简化部署流程,适用于 NLP 和多模态任务。

OpenAI Blog ★★★★☆ 2021-01-25

Scaling Kubernetes to 7,500 nodes

推荐理由:涉及大模型基础设施,与AI模型训练密切相关

OpenAI分享将Kubernetes集群扩展至7500节点的经验,支撑GPT-3、CLIP、DALL·E等大模型训练及小规模快速迭代研究。

OpenAI Blog ★★★★☆ 2021-01-05

DALL·E: Creating images from text

推荐理由:涉及AI模型发布及多模态生成技术,属核心AI进展

OpenAI发布DALL·E模型,可根据自然语言文本生成对应图像,展示AI在多模态生成领域的强大能力。

OpenAI Blog ★★★★☆ 2021-01-05

CLIP: Connecting text and images

推荐理由:重要多模态模型发布,具零样本能力

OpenAI发布CLIP模型,通过自然语言监督学习视觉概念,支持零样本图像分类,仅需提供类别名称即可应用于各类视觉任务。

Lilian Weng's Blog ★★★★☆ 2021-01-02

Controllable Neural Text Generation

推荐理由:涵盖AI模型可控生成关键技术,与模型服务优化密切相关

文章综述了可控神经文本生成的多种技术路径,包括引导解码、提示设计(如P-tuning、Prompt Tuning)和微调方法等,旨在让大语言模型生成符合特定属性的内容。

Hugging Face Blog ★★★★☆ 2020-11-03

将 fairseq wmt19 翻译系统迁移到 transformers

推荐理由:涉及主流AI工具库迁移实践,对NLP开发者有实用价值

本文介绍了如何将基于 fairseq 的 WMT19 机器翻译系统迁移到 Hugging Face Transformers 库,涵盖模型转换、配置适配及推理优化等关键技术步骤。

Hugging Face Blog ★★★★☆ 2020-11-02

使用 Transformers 和 Ray Tune 进行超参数搜索

推荐理由:实用的AI模型调优工具链教程,适合开发者提升训练效率。

本文介绍如何结合 Hugging Face Transformers 与 Ray Tune 实现高效的超参数优化,涵盖分布式调参、早停策略及实际代码示例。

Lilian Weng's Blog ★★★☆☆ 2020-10-29

How to Build an Open-Domain Question Answering System?

推荐理由:涉及AI模型应用与实践,契合AI工具与系统构建主题

文章介绍了构建开放域问答系统(ODQA)的常见方法,包括闭卷和开卷两种范式,并结合预训练语言模型及OpenAI API示例进行说明。

Hugging Face Blog ★★★☆☆ 2020-10-10

Transformer-based Encoder-Decoder Models

推荐理由:涵盖主流AI模型架构,对理解大模型基础有帮助

文章介绍基于Transformer的编码器-解码器模型架构,包括其在序列到序列任务中的应用、关键组件及典型变体。

Hugging Face Blog ★★★★☆ 2020-09-10

用于更小更快语言模型的块稀疏矩阵

推荐理由:涉及AI模型优化技术,有助于提升模型效率和落地应用

文章探讨如何利用块稀疏矩阵技术压缩和加速大语言模型,提升推理效率并减少内存占用,适用于部署资源受限场景。

← 上一页 80 / 90 下一页 →