笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2023-11-07

使用 AWS Inferentia2 加速 Llama 模型推理

推荐理由：涉及大模型推理优化与云服务部署，属AI模型服务评测与应用范畴

本文介绍如何利用 AWS Inferentia2 芯片显著提升 Llama 系列大模型的推理速度，降低延迟与成本，并提供部署优化实践。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-11-07

推出 Prodigy-HF：与 Hugging Face 的直接集成

推荐理由：推荐热门 AI 工具库集成，提升数据标注与模型训练效率

Prodigy 推出 Prodigy-HF，实现与 Hugging Face 的无缝集成，支持在 Prodigy 中直接加载和标注 HF 数据集、训练模型并回传结果，提升 AI 数据标注与模型迭代效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-11-07

大语言模型性能对比：深入分析RoBERTa、Llama 2和Mistral在灾难推文分类任务中结合LoRA的表现

推荐理由：涉及主流大模型性能评测与LoRA微调实践，契合AI模型评测与工具使用主题。

文章对比了RoBERTa、Llama 2和Mistral三种大模型在灾难推文分类任务中的表现，并结合LoRA微调技术评估其效果与效率，提供了详细的基准测试结果。

阅读原文 →

OpenAI Blog ★★★★☆ 2023-11-06

Introducing GPTs

推荐理由：涉及AI模型新功能发布及应用方式，契合AI工具使用与商业化场景。

OpenAI推出GPTs，用户可基于ChatGPT创建具备特定指令、知识和技能组合的定制化AI助手。

阅读原文 →

OpenAI Blog ★★★★☆ 2023-11-06

New models and developer products announced at DevDay

推荐理由：涵盖最新AI模型发布及开发者产品，契合AI工具与模型评测兴趣

OpenAI在DevDay发布GPT-4 Turbo（128K上下文、更低价格）、带视觉能力的GPT-4 Turbo、Assistants API和DALL·E 3 API等新模型与开发者工具。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-27

个人Copilot：训练你自己的编程助手

推荐理由：提供AI辅助编程的实用教程和工具链，契合用户对AI vibe coding的兴趣。

介绍如何利用开源模型和本地数据训练个性化的AI编程助手，支持代码补全、错误修复和上下文理解，适用于VS Code等主流IDE。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2023-10-25

Adversarial Attacks on LLMs

推荐理由：涉及AI模型安全性及对抗攻击技术，属模型评测与应用风险范畴

文章探讨大语言模型（LLM）面临的对抗攻击与越狱提示风险，分析文本领域对抗攻击的挑战，并关联可控文本生成技术。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-25

一行代码即可交互式探索你的 Hugging Face 数据集

推荐理由：推荐热门AI工具库，简化数据集探索流程

介绍了一个开源工具，只需一行代码即可在本地启动交互式界面，用于浏览和分析 Hugging Face 上的数据集，提升数据预处理效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-24

使用 Hugging Face 推理端点部署嵌入模型

推荐理由：提供主流AI工具库的实操部署指南，适合开发者快速上手

本文介绍如何通过 Hugging Face Inference Endpoints 快速部署嵌入模型，涵盖模型选择、端点配置、API 调用及性能优化等实用步骤。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-24

基于PPO的RLHF的N个实现细节

推荐理由：详解RLHF与PPO结合的核心实现技巧，对AI模型训练有实用参考价值

文章深入解析了使用近端策略优化（PPO）实现人类反馈强化学习（RLHF）的关键技术细节，涵盖奖励建模、策略训练和稳定性优化等实践要点。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-24

探索SDXL的简单优化方法

推荐理由：涉及主流AI生成模型SDXL的优化实践，属热门AI工具库应用

文章探讨了对Stable Diffusion XL（SDXL）模型进行简单优化的技术手段，包括推理加速、内存占用降低和生成质量微调等实用技巧。

阅读原文 →

OpenAI Blog ★★★★☆ 2023-10-19

DALL·E 3 is now available in ChatGPT Plus and Enterprise

推荐理由：涉及主流AI模型新版本发布及安全机制，属核心AI服务更新

DALL·E 3现已集成至ChatGPT Plus和企业版，并介绍了其安全缓解措施与内容溯源研究进展。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-19

Gradio-Lite：完全在浏览器中运行的无服务器 Gradio

推荐理由：推荐热门 AI 工具库 Gradio 的创新用法，便于本地和前端集成。

Gradio-Lite 是一个新版本的 Gradio，可在浏览器中无需服务器直接运行 AI 应用，基于 Pyodide 技术，适合快速部署轻量级 demo。

阅读原文 →

OpenAI Blog ★★★★☆ 2023-10-11

Building AI-powered apps for business

推荐理由：展示AI在企业应用开发中的落地实践

Retool 利用 GPT-4 为企业提供快速、安全的 AI 应用构建平台，降低开发门槛，助力业务自动化与智能化。

阅读原文 →

OpenAI Blog ★★★★☆ 2023-10-11

Simplifying contract reviews with AI

推荐理由：展示AI在法律行业的商业化应用案例

Ironclad 利用 GPT-4 简化合同审查流程，提升法律文档处理效率。

阅读原文 →

OpenAI Blog ★★★★☆ 2023-10-11

OpenAI’s technology explained

推荐理由：涵盖大模型技术细节与应用，符合模型发布与评测兴趣

文章深入解析OpenAI的核心技术，包括GPT系列模型架构、训练方法及推理优化策略，并探讨其在实际产品中的应用方式。

阅读原文 →

OpenAI Blog ★★★★☆ 2023-10-11

Evolving online forms into dynamic data

推荐理由：展示AI在表单产品中的商业化应用

Typeform 利用 GPT-3.5 和 GPT-4 将传统在线表单升级为动态、对话式的数据收集体验，提升用户交互与数据质量。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-04

使用 ONNX Runtime 加速超过 13 万个 Hugging Face 模型

推荐理由：涉及主流 AI 模型优化工具与开源生态整合，实用性强。

微软宣布通过 ONNX Runtime 对 Hugging Face 上超 13 万 AI 模型提供推理加速支持，涵盖 NLP、CV 等领域，显著提升性能并降低部署成本。

阅读原文 →

OpenAI Blog ★★★★☆ 2023-10-03

DALL·E 3 system card

推荐理由：涵盖新模型发布细节与技术评测，符合AI模型发布及评测兴趣

DALL·E 3系统卡详细介绍了该多模态生成模型的技术规格、安全机制、训练数据及使用限制，强调其与ChatGPT集成的能力和对提示词的精细理解。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-03

🧨 使用 JAX 在 Cloud TPU v5e 上加速 Stable Diffusion XL 推理

推荐理由：涉及热门AI模型部署优化与工具库实践

本文介绍如何利用 JAX 框架在 Google Cloud TPU v5e 上优化 Stable Diffusion XL 的推理速度，涵盖代码示例与性能对比。

阅读原文 →