OpenAI o1 System Card
推荐理由:涉及大模型发布前的安全评测,属AI模型发布及评测范畴
OpenAI发布o1系列模型前的安全评估报告,涵盖外部红队测试和前沿风险评估,依据其Preparedness Framework进行。
推荐理由:涉及大模型发布前的安全评测,属AI模型发布及评测范畴
OpenAI发布o1系列模型前的安全评估报告,涵盖外部红队测试和前沿风险评估,依据其Preparedness Framework进行。
推荐理由:体现AI在金融领域的商业化应用案例
摩根士丹利利用AI评估工具推动金融服务创新,通过定制化AI模型提升客户服务与运营效率,展示了AI在金融行业的实际落地应用。
推荐理由:涉及AI在企业中的实际应用与落地,符合AI商业化主题。
文章探讨如何在全球性组织中部署和应用ChatGPT,提升工作效率与协作能力,涵盖实际落地场景与实施策略。
推荐理由:涉及大模型视觉能力微调及实际应用,契合AI模型应用与工具使用主题
文章介绍如何通过微调GPT-4o的视觉能力来构建更智能的地图系统,提升地图对图像数据的理解与结构化输出能力。
推荐理由:涉及AI商业化应用及大模型落地案例
Rox宣布全面采用OpenAI模型,结合其商业经验与大语言模型技术,旨在赋能销售人员成为顶尖销售。
推荐理由:展示AI在美妆行业的商业化落地案例
雅诗兰黛公司利用ChatGPT挖掘数据洞察,驱动美妆产品创新与消费者体验优化,展示了AI在消费品行业的实际应用。
推荐理由:涉及AI模型新功能发布,属核心兴趣领域
OpenAI推出ChatGPT搜索功能,可快速提供附带相关网页链接的及时答案,增强信息溯源与实时性。
推荐理由:展示AI在垂直行业的商业化应用案例
Promega公司自上而下全面采用ChatGPT,显著提升制造、销售与营销效率,展示了AI在生命科学行业中的实际落地应用。
推荐理由:聚焦AI在营销领域的商业化应用与实践案例
文章探讨如何将AI应用于营销团队,提升内容创作、客户洞察和广告投放效率,涵盖具体工具和落地场景。
推荐理由:属于AI模型评测新基准,契合用户对模型评测的关注
SimpleQA是一个用于评估语言模型回答简短事实性问题能力的新基准测试,聚焦模型的事实准确性表现。
推荐理由:展示AI在客服领域的商业化应用案例
Decagon与OpenAI合作推出高性能、全自动化的客户支持系统,实现大规模客户服务的AI落地应用。
推荐理由:涉及AI生成模型新技术,属模型性能改进与评测范畴
研究简化并扩展了连续时间一致性模型,在仅用两步采样的情况下达到与主流扩散模型相当的生成质量。
推荐理由:涉及AI模型在编程等领域的实际应用,契合用户兴趣。
视频展示了OpenAI o1推理模型在编程、策略和研究等复杂问题中的应用能力。
推荐理由:涉及大模型行为评测与公平性分析
研究分析ChatGPT如何根据用户姓名调整回复,探讨其公平性问题,使用AI研究助手保护隐私。
推荐理由:提供AI智能体在ML工程中的评测标准,契合模型评测兴趣点
MLE-bench 是一个用于评估AI智能体在机器学习工程任务中表现的新基准,涵盖数据处理、模型训练与调优等环节。
推荐理由:涉及AI辅助编程新功能,契合vibe coding趋势
OpenAI推出Canvas功能,为ChatGPT用户提供全新代码编写与协作方式,支持实时编辑和可视化编程界面,提升AI辅助编程体验。
推荐理由:涉及AI模型服务发布及商业化应用
OpenAI推出Realtime API,支持开发者在应用中快速构建语音到语音的实时交互体验,适用于客服、语音助手等场景。
推荐理由:涉及大模型新功能发布及 AI 编程应用
OpenAI 推出支持图像和文本的 GPT-4o 微调 API,开发者可借此提升模型视觉能力。
推荐理由:涉及AI服务优化与成本控制,属AI服务发布及评测范畴
API新增Prompt Caching功能,对模型近期处理过的输入自动提供费用折扣,提升重复请求的性价比。
推荐理由:涉及AI模型优化与服务发布,实用性强
OpenAI平台支持通过前沿大模型的输出对小模型进行微调(即模型蒸馏),以构建成本更低、性能接近的定制化模型。