site:www.51cto.com - 搜索 News

资讯

4 小时

如此巨额的投入远超多数科技公司自身的资金承载能力，不仅是甲骨文，众多企业开始转向外部债务市场寻求资金支持，这一市场的规模正不断扩大且潜力显著，甚至被华尔街金融从业者比作“现代淘金热”。

6 小时

实验结果已经证明，基于虚拟轨迹或执行验证数据训练的模型，能够在多个基准任务上达到接近甚至媲美闭源前沿模型的性能。这表明先进网络安全能力的民主化不仅在技术上可行，而且正在快速到来。如何确保这类能力更多地服务于防御，而不是被滥用于攻击，将是未来亟需讨论的 ...

6 小时

此前，ChatGPT 官方只支持少数经过验证的 MCP，比如 Canva、Gmail 等接口（见下图）。而在开发者模式下，任何 MCP 服务器工具都能被直接引入 ChatGPT，对外部服务进行修改、写入甚至自动化操作。

6 小时

需要强调的是：未做重要性加权的那次运行在Step 318左右出现显著的损失峰值，同时KL散度同步陡升；而做了异策略校正或实现「真正同策略」的两种设置，RL都能持续、平滑地优化。

6 小时

这篇博客属于 Thinking Machines Lab 新提出的博客栏目 Connectionism，意为「连接主义」。该公司表示：「我们相信，分享才能让科学更好地发展。Connectionism ...

9 小时

员工常通过安全团队无法监控的设备，向聊天机器人或AI助手分享客户记录、财务数据，甚至账号凭证。一旦这些数据进入AI系统，便再也无法撤回——它们可能在训练模型中留存数年，其访问方式往往超出企业的预测范围。

10 小时

从测试结果来看，K2 Think在多项数学基准测试中，拿下了较为理想的分数，例如AIME’24 90.83分、AIME’25 81.24分、HMMT25 73.75分，以及Omni-MATH-HARD上取得60.73分的成绩。

10 小时

9 月 8 日，Node.js 生态链遭遇前所未有的冲击。资深 npm 维护者 Qix（Josh Junon）因一封钓鱼邮件泄露了账户，攻击者趁机在多个热门包里植入了恶意代码。这次事件迅速引爆社区，成为开源史上下载量最大的供应链攻击之一。

21 小时

随着 AI 大模型在医疗咨询、法律建议等高风险领域的应用不断深入，幻觉问题会变得越来越棘手，因此不少研究者都在往这一方向发力。除了像 OpenAI ...

13 小时

New Scientist在一篇文章中表示，AI出现一定程度的幻觉是难以避免的，人类可以通过检索增强生成技术来缓解，也就是让模型参考外部数据，进行交叉对比。问题在于，随着模型的扩大，“幻觉率”似乎并没有降低，反而提高了。

6 小时

开源头方面，王院士指出：开源人工智能是历史趋势，美国今年以来的出口管制政策（王院士同时指出，这个政策也有一个漏洞）是阻挡不了的，同时提出，现在模型的开放权重，本质上就是对数据和计算资源的开源。

6 小时

近年来，以 Google 的 AlphaEvolve 为代表的研究已经证明，AI 智能体可以通过迭代来优化算法，甚至在某些小型、独立的编程任务上超越人类。然而，这些工作大多局限于几百行代码的「算法内核」或单个文件。

一些您可能无法访问的结果已被隐去。