笑笑乐园 - 朝花夕拾

Lilian Weng's Blog ★★★★☆ 2020-08-06

Neural Architecture Search

推荐理由：涉及AI模型自动化设计，属热门AI工具库与技术方向

文章探讨神经架构搜索（NAS）技术，将其方法分解为搜索空间、搜索算法和子模型演化策略三部分，综述了实现更高效、低成本自动设计高性能神经网络的前沿思路。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2020-04-07

The Transformer Family

推荐理由：深入解析主流AI模型架构演进，契合模型评测与技术发展兴趣

文章系统梳理了Transformer模型的多种改进版本，涵盖长序列注意力、计算与内存优化、强化学习任务适配等方向，并于2023年更新至第二版，涵盖2020年以来的新进展。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2019-11-10

Self-Supervised Representation Learning

推荐理由：涵盖主流自监督学习模型与技术演进，对理解AI模型训练有重要参考价值。

文章深入探讨自监督表征学习在图像、视频和控制问题中的多种方法，包括对比预测编码、MoCo、SimCLR、BYOL等关键技术。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2019-09-05

Evolution Strategies

推荐理由：涉及AI模型训练的替代优化方法，属AI技术底层研究

文章介绍进化策略（ES）作为黑盒优化方法，适用于无法计算梯度的场景，并探讨其在深度强化学习中的应用。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2019-06-23

Meta Reinforcement Learning

推荐理由：涉及AI前沿模型技术，符合模型发布与评测类兴趣

文章探讨元强化学习（Meta-RL），即在多个强化学习任务上训练后，智能体能快速适应新任务。内容涵盖Meta-RL的起源及其三大核心组件，属于AI模型方法论的深入解析。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2019-01-31

Generalized Language Models

推荐理由：覆盖多个重要大模型的技术演进，符合AI模型发布及评测兴趣

文章系统梳理了从ELMo、GPT、BERT到RoBERTa、T5、GPT-3等主流大语言模型的发展脉络与技术特点，涵盖其预训练方法和在各类NLP任务中的表现。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2018-12-27

Object Detection Part 4: Fast Detection Models

推荐理由：涵盖主流AI视觉模型及其技术原理，属AI模型评测与应用范畴

本文介绍了一阶段目标检测模型（如SSD、RetinaNet和YOLO系列），这些模型跳过区域提议阶段，直接在密集采样区域进行检测，适用于对速度要求高的场景。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2018-10-13

Flow-based Deep Generative Models

推荐理由：属于AI模型基础研究，有助于理解生成模型技术演进

文章介绍基于流的深度生成模型（Flow-based Models），作为与GAN、VAE并列的第三类生成模型，其特点是可以显式学习输入数据的概率密度函数。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2018-06-24

Attention? Attention!

推荐理由：系统梳理注意力机制核心技术，对理解大模型基础至关重要。

文章深入讲解注意力机制的发展历程及多种变体，包括Transformer、Pointer Network、Neural Turing Machines等，并附有代码实现链接。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2018-05-05

Implementing Deep Reinforcement Learning Models with Tensorflow + OpenAI Gym

推荐理由：涵盖热门AI工具库与实践教程，适合开发者学习参考。

本文介绍如何使用TensorFlow和OpenAI Gym实现多种经典深度强化学习模型，并提供完整开源代码。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2018-04-08

Policy Gradient Algorithms

推荐理由：涵盖主流强化学习算法，属AI模型核心技术内容

深入解析策略梯度算法原理及近年提出的多种变体，包括PPO、SAC、DDPG、A3C等，并持续更新最新方法。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2018-01-23

The Multi-Armed Bandit Problem and Its Solutions

推荐理由：涵盖AI决策算法及开源实现，适用于推荐系统等商业化场景

文章介绍了多臂老虎机问题及其在探索与利用权衡中的应用，并提供了伯努利老虎机的算法实现，涉及在线推荐和广告等AI应用场景。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2017-12-31

Object Detection for Dummies Part 3: R-CNN Family

推荐理由：涵盖主流AI模型技术演进，符合AI模型评测与学习需求

文章系统讲解了R-CNN家族的四个关键目标检测模型（R-CNN、Fast R-CNN、Faster R-CNN和Mask R-CNN），分析其演进与速度优化，适合理解经典AI视觉模型发展。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2017-10-15

Learning Word Embedding

推荐理由：涉及AI基础技术中的词嵌入模型与表示学习

文章介绍了词嵌入（word embedding）的基本概念及其学习方法，包括如何将自然语言转换为数值向量，并对比了one-hot编码与稠密向量表示的优劣。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2017-09-28

Anatomize Deep Learning with Information Theory

推荐理由：涉及AI模型理论基础与训练机制，对理解大模型有启发

文章介绍了Tishby教授提出的用信息论研究深度学习的新视角，包括信息瓶颈方法和DNN训练的两个阶段：拟合与压缩。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2017-08-20

From GAN to WGAN

推荐理由：详解GAN到WGAN的技术演进，对理解生成模型训练机制有帮助

文章深入讲解了GAN的数学原理及其训练难点，并介绍了Wasserstein GAN（WGAN）如何通过使用更平滑的概率分布距离度量来改善训练稳定性。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2017-08-01

How to Explain the Prediction of a Machine Learning Model?

推荐理由：涉及AI模型透明性与落地合规，契合AI商业化应用主题

文章探讨机器学习模型可解释性，涵盖可解释模型与黑盒模型的解释方法，并讨论可解释AI在医疗、司法等关键领域的必要性。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2017-07-08

Predict Stock Prices Using RNN: Part 1

推荐理由：提供AI模型实战教程及开源代码，契合AI工具使用与应用落地主题

本文教程介绍如何使用TensorFlow构建RNN模型预测标普500指数价格，附完整开源代码，适合学习AI在金融时序预测中的基础应用。

阅读原文 →