通过 API 中的新模型推进语音智能
OpenAI:官网动态(RSS · 排除企业/客户案例)
OpenAI API 推出了新的实时语音模型,能够进行推理、翻译和语音转录。这些模型显著提升了语音交互的自然度与智能...
ClawsData
按天整理 AI 模型发布、产品更新、论文研究、行业事件与技巧观点。
VOL.2026.05.08·30 STORIES·CLAWS DATA DAILY
Model Releases
OpenAI:官网动态(RSS · 排除企业/客户案例)
OpenAI API 推出了新的实时语音模型,能够进行推理、翻译和语音转录。这些模型显著提升了语音交互的自然度与智能...
X:蚂蚁百灵 (@AntLingAGI)
inclusionAI宣布Ling-2.6-1T现已在OpenRouter上线。🚀 这款万亿参数旗舰指令模型专为现实...
OpenAI:官网动态(RSS · 排除企业/客户案例)
OpenAI扩展了网络安全领域的可信访问计划,推出了GPT-5.5和专门针对网络安全的GPT-5.5-Cyber模型...
Product
Claude:Blog(网页)
Claude for Excel、PowerPoint和Word现已全面上市,Outlook版本开放公开测试。Cla...
X:邵猛 (@shao__meng)
Amp发布CLI工具Neo,标志着Coding Agent从“陪伴式”转向“长链路”新方向,核心是减少人工介入、支持...
X:OpenAI (@OpenAI)
Codex现可直接在macOS和Windows的Chrome中运行。 它在处理Chrome中的应用和网站时表现更佳,...
X:宝玉 (@dotey)
OpenAI 在 GitHub 开源了官方命令行工具 openai-cli,采用 Apache 2.0 协议,支持通...
X:Oran Ge (@oran_ge)
开发者开源了一款专为AI Agent设计的网盘NeuDrive,能够自动同步Agent的记忆、技能和文件。该工具支持...
Hacker News 热门(buzzing.cc 中文翻译)
DeepSeek 4 Flash 本地推理引擎正式发布,这是一个专为苹果 Metal 框架优化的开源项目。它允许开发...
Anthropic:Research(发表成果 · 网页)
2025年10月,Anthropic公司开源了AI模型对齐测试工具箱Petri,用于快速检测模型的欺骗、奉承等风险倾...
OpenRouter:Announcements(RSS)
该工具赋予任何具备工具调用能力的模型自主进行网络搜索和抓取网页内容的功能。它支持多种搜索引擎和抓取引擎供用户选择,实...
Industry
IT之家(RSS)
据报道,苹果内置摄像头的AirPods已进入设计验证测试(DVT)阶段,最快有望于今年9月作为其首款AI可穿戴设备发...
IT之家(RSS)
全国首例AI短剧侵权刑事案一审宣判。被告人盗录某公司AI工具生成的短剧超过1700部,并在二手平台以66.66元打包...
X:Replit (@Replit)
首届连接代码与文化的AI创意大会将于6月17日至18日登陆纽约。 早鸟票数量有限现已开售。 趁早抢购以免错失良机。 ...
X:Suno (@suno)
NBC News刚刚重点报道了使用Suno的短信转歌曲病毒式趋势! https://www.nbcnews.com/...
Apple:Newsroom(RSS)
本届 Swift Student Challenge 评选出四位获奖者,他们开发的创新应用深度融合人工智能技术,并聚...
Cloudflare Blog
Cloudflare向全球团队发送内部邮件,宣布公司迎来一个重大时刻。公司秉持透明度这一核心价值观,决定直接向外界同...
Research
Anthropic:Research(发表成果 · 网页)
Anthropic团队推出自然语言自编码器方法,能将大模型内部的激活值直接解码为可读文本。该方法通过训练“激活描述器...
X:Kim (@kimmonismus)
谷歌团队通过Fitbit对近1.4万名用户进行了为期9个月的AI症状检查测试。在盲评中,临床医生将AI诊断列为首选的...
X:智谱 Z.ai (@Zai_org)
GLM-5V-Turbo 技术报告:迈向原生多模态智能体基础模型 本报告总结了GLM-5V-Turbo在模型设计、多...
Apple Machine Learning Research(RSS)
研究人员提出文本条件联合嵌入预测架构(TC-JEPA),通过引入图像描述文本作为条件信息来降低掩码特征预测中的视觉不...
Apple Machine Learning Research(RSS)
学习型编解码器相比传统硬编码方法的显著优势在于能直接针对人类视觉系统进行优化,但目前尚未出现兼具感知质量与实用性的图...
Tips & Takes
X:宝玉 (@dotey)
在马斯克起诉OpenAI案的庭审中,前CTO Mira Murati的证词及2023年11月政变之夜的内部短信被公开...
GitHub Blog
这份指南提供了审查由AI代理生成的pull requests的实用方法,重点包括审查时应关注的代码变更点、问题常见隐...
Simon Willison 博客
作者开发了一个名为“GitHub Repo Stats”的在线工具,用于解决GitHub移动端网站不显示仓库提交次数...
X:Rohan Paul (@rohanpaul_ai)
Proprioceptive AI开发的Cygnus技术,通过为冻结的大语言模型添加自感知适配器,使其能读取内部认知...
X:OpenAI Developers (@OpenAIDevs)
正在用GPT-Realtime-2构建语音应用? 我们的新提示指南涵盖如何调整推理强度、使用前导说明、设计工具行为、...
X:Berry Xia (@berryxia)
SenseNova-U1开源了一项8步蒸馏LoRA技术,将扩散模型的生成步骤从100步压缩至8步,使GPU推理时间从...
X:Vista (@vista8)
开源项目 Open Slide 基于 React 框架构建 PPT,其工作流专为 AI Agent 设计。它利用丰富...
X:Oran Ge (@oran_ge)
作者为解决制作演示文稿时修改不便的问题,受“Markdown as Database”理念启发,在ColaMD 1....