全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
OpenAI Blog ★★★★☆ 2018-04-18

Evolved Policy Gradients

推荐理由:涉及AI模型训练新方法,属前沿模型技术探索

OpenAI发布实验性元学习方法Evolved Policy Gradients(EPG),通过进化学习智能体的损失函数,使其在训练分布外的新任务上快速适应,如在测试时成功导航到训练中未见过位置的物体。

OpenAI Blog ★★★★☆ 2018-04-10

Gotta Learn Fast: A new benchmark for generalization in RL

推荐理由:涉及AI模型评测与新基准发布,契合用户关注点

提出新强化学习基准Gotta Learn Fast(GLaF),用于评估智能体在分布外任务上的泛化能力,包含多样化环境和难度渐进机制,并对现有算法进行评测。

Lilian Weng's Blog ★★★★☆ 2018-04-08

Policy Gradient Algorithms

推荐理由:涵盖主流强化学习算法,属AI模型核心技术内容

深入解析策略梯度算法原理及近年提出的多种变体,包括PPO、SAC、DDPG、A3C等,并持续更新最新方法。

OpenAI Blog ★★★☆☆ 2018-03-15

Improving GANs using optimal transport

推荐理由:涉及AI模型优化方法,属热门研究方向

论文提出利用最优传输理论改进生成对抗网络(GANs),通过更稳定的训练目标和更好的分布对齐提升生成质量。

OpenAI Blog ★★★☆☆ 2018-03-08

On first-order meta-learning algorithms

推荐理由:涉及AI模型训练前沿技术,对开发者理解元学习有参考价值

论文探讨一阶元学习算法,分析其在少样本学习中的有效性,并提出简化计算的优化方法,对理解模型快速适应新任务机制有重要意义。

OpenAI Blog ★★★★☆ 2018-03-07

Reptile: A scalable meta-learning algorithm

推荐理由:介绍新型AI训练算法,属热门AI工具库及技术进展

OpenAI提出Reptile算法,一种简单高效的元学习方法,通过多次采样任务并沿任务优化方向更新初始参数,与一阶MAML效果相当但实现更简便。

OpenAI Blog ★★★★☆ 2018-02-26

Ingredients for robotics research

推荐理由:涉及AI模型在机器人领域的应用与开源工具发布

OpenAI开源8个机器人仿真环境及Hindsight Experience Replay基线实现,支持从仿真到实体机器人的模型迁移,并提出机器人研究方向建议。

OpenAI Blog ★★★☆☆ 2018-02-15

Interpretable machine learning through teaching

推荐理由:涉及AI可解释性与模型教学机制,属AI模型技术前沿

提出一种可解释机器学习方法,通过让AI互相教学并自动选择对人类也易懂的示例(如用最佳图像解释“狗”的概念),提升模型可解释性与教学效果。

OpenAI Blog ★★★★☆ 2018-01-31

Requests for Research 2.0

推荐理由:涉及AI模型前沿研究问题,对开发者和研究者有启发价值

OpenAI发布了七个在其研究过程中遇到的未解决问题,涵盖AI模型能力、对齐、推理等多个方向,旨在推动社区共同探索前沿课题。

Lilian Weng's Blog ★★★☆☆ 2018-01-23

The Multi-Armed Bandit Problem and Its Solutions

推荐理由:涵盖AI决策算法及开源实现,适用于推荐系统等商业化场景

文章介绍了多臂老虎机问题及其在探索与利用权衡中的应用,并提供了伯努利老虎机的算法实现,涉及在线推荐和广告等AI应用场景。

Lilian Weng's Blog ★★★☆☆ 2017-12-31

Object Detection for Dummies Part 3: R-CNN Family

推荐理由:涵盖主流AI模型技术演进,符合AI模型评测与学习需求

文章系统讲解了R-CNN家族的四个关键目标检测模型(R-CNN、Fast R-CNN、Faster R-CNN和Mask R-CNN),分析其演进与速度优化,适合理解经典AI视觉模型发展。

OpenAI Blog ★★★★☆ 2017-12-06

Block-sparse GPU kernels

推荐理由:涉及AI模型底层优化工具,属热门AI工具库范畴

发布针对块稀疏神经网络的高性能GPU内核,显著超越cuBLAS/cuSPARSE性能,并已用于文本情感分析和图文生成任务。

OpenAI Blog ★★★★☆ 2017-12-04

Learning sparse neural networks through L₀ regularization

推荐理由:涉及AI模型优化技术,对模型压缩与高效推理有实用价值

提出一种基于L₀范数正则化的神经网络稀疏化方法,通过可微近似实现端到端训练,在保持性能的同时显著减少参数量和计算开销。

OpenAI Blog ★★★☆☆ 2017-10-26

Learning a hierarchy

推荐理由:涉及AI模型新方法,对强化学习应用有参考价值

提出一种分层强化学习算法,能自动学习高层动作(如行走、爬行方向),显著提升智能体在复杂导航任务中的学习效率。

OpenAI Blog ★★★☆☆ 2017-10-19

Generalizing from simulation

推荐理由:涉及AI模型从仿真到现实的迁移应用,属AI技术落地案例

新机器人技术使在仿真中训练的控制器能部署到实体机器人上,并对环境变化做出实时反应,实现闭环控制。

OpenAI Blog ★★★☆☆ 2017-10-18

Asymmetric actor critic for image-based robot learning

推荐理由:涉及AI在机器人领域的前沿算法应用,属AI模型技术进展

提出一种非对称Actor-Critic算法,用于基于图像的机器人学习,通过在策略网络和价值网络中使用不同信息提升样本效率和性能。

Lilian Weng's Blog ★★★☆☆ 2017-10-15

Learning Word Embedding

推荐理由:涉及AI基础技术中的词嵌入模型与表示学习

文章介绍了词嵌入(word embedding)的基本概念及其学习方法,包括如何将自然语言转换为数值向量,并对比了one-hot编码与稠密向量表示的优劣。

← 上一页 84 / 90 下一页 →