Defining and evaluating political bias in LLMs
推荐理由:涉及大模型评测与偏见控制,属AI模型评测范畴
OpenAI提出新方法评估ChatGPT中的政治偏见,通过真实场景测试提升模型客观性并减少偏见。
推荐理由:涉及大模型评测与偏见控制,属AI模型评测范畴
OpenAI提出新方法评估ChatGPT中的政治偏见,通过真实场景测试提升模型客观性并减少偏见。
推荐理由:展示AI在HR SaaS产品中的规模化落地与商业化应用
HiBob利用ChatGPT Enterprise和2500个定制GPT,推动产品与团队增长,提升营收并优化HR工作流,将AI能力集成到Bob平台中。
推荐理由:提供AI编程模型评测新方法,对AI辅助编程工具开发者有参考价值
BigCodeArena 是一个端到端的代码生成评测框架,通过实际执行生成的代码来评估其正确性与鲁棒性,相比传统基于文本匹配的方法更贴近真实开发场景。
推荐理由:涉及AI编程工具Codex的新功能与SDK,契合AI辅助编程主题
OpenAI Codex正式全面上线,新增Slack集成、Codex SDK及管理工具(如用量仪表盘和工作区管理),便于开发者大规模使用和管理。
推荐理由:涉及AI工具链新SDK发布,契合AI工具库与开发生态主题
OpenAI推出ChatGPT内置应用功能及Apps SDK预览版,开发者可构建可在ChatGPT内直接交互的应用。
推荐理由:涉及AI基础设施关键硬件合作,影响大模型训练能力
AMD与OpenAI达成多年合作,计划从2026年起部署总计6吉瓦的AMD Instinct GPU,用于支持OpenAI下一代AI基础设施。
推荐理由:涉及AI智能体开发工具与模型优化技术,契合AI工具库与模型服务主题
Anthropic发布AgentKit、新评估工具和基于强化学习的微调(RFT)功能,帮助开发者加速智能体从原型到生产的落地。
推荐理由:展示GPT-5在消费级AI产品中的落地应用与规模化案例
韩国公司Wrtn基于GPT-5打造“生活方式AI”,融合生产力、创意与学习功能,已覆盖650万用户,并计划拓展至东亚市场。
推荐理由:涉及热门 AI 工具库在 OCR 场景的应用与部署
文章介绍如何结合 Apple 的 Core ML 与开源 OCR 工具 dots.ocr,构建高性能的光学字符识别系统,并展示了其在移动端部署的优势和实际效果。
推荐理由:涉及AI模型评测新标准,契合模型服务评测兴趣
RTEB 是一个新的检索评估基准,旨在更真实地模拟实际应用场景,涵盖多跳推理、时效性与多模态查询等挑战,提升检索系统评测的实用性。
推荐理由:属于AI模型新版本发布及功能评测范畴
OpenAI发布Sora 2视频生成模型,具备更高物理准确性、真实感和可控性,并支持同步对白与音效,现已上线Sora应用。
推荐理由:属于大模型新版本发布及能力评测范畴
Sora 2是OpenAI推出的新型音视频生成模型,相比前代在物理准确性、画面真实感、音画同步、可控性和风格多样性方面有显著提升。
推荐理由:涉及大模型新版本发布及安全机制,属AI模型发布与评测范畴
OpenAI发布Sora 2视频生成模型及配套应用,强调以安全为核心设计,应对前沿视频模型带来的新型安全挑战。
推荐理由:展示AI在企业数据分析中的实际应用案例
OpenAI推出研究助手,帮助团队快速分析海量客服工单、提取洞察并提升全公司范围内的探索效率。
推荐理由:展示AI在企业内部的实际应用与最佳实践
OpenAI推出新系列“OpenAI on OpenAI”,分享如何利用自家AI技术提升工作效率、扩展专业能力并推动成果落地的经验。
推荐理由:展示了AI在企业合同处理中的实际应用案例
OpenAI开发了一套系统,能快速提取合同数据,缩短处理时间并提升团队查询效率。
推荐理由:展示AI在企业服务中的实际应用与效果
OpenAI利用AI优化客户支持,通过自动化和智能系统缩短响应时间、提升服务质量,并支撑业务高速增长。
推荐理由:体现AI商业化落地案例,具参考价值
OpenAI利用AI实现大规模个性化回复,高效转化潜在客户为付费用户,展示了AI在销售与客户转化中的实际应用。
推荐理由:涉及AI商业化应用及新交互模式
OpenAI在ChatGPT中推出即时结账功能,探索AI代理与用户、商家协同购物的“代理商务协议”,推动AI在电商场景的商业化落地。
推荐理由:涉及大模型优化与硬件加速,属AI模型部署实用技术
文章介绍如何通过深度剪枝的草稿模型,在Intel Core Ultra处理器上高效加速Qwen3-8B大模型推理,提升AI智能体运行效率。