浏览：强化学习

国产AI最卷一夜，大模型黑马DeepSeek、Kimi硬刚OpenAI o1，实测体验到底有多强

2个月前阅读约需 8 分钟

赶在放假前，支棱起来的国产 AI 大模型厂商井喷式发布了一大堆春节礼物。前脚 DeepSeek-R1 正式发布，号称性能对标 OpenAI o1 正式版，后脚 k1.5 新模型也正式登场，表示性能做到满血版多模态 o1 水平。

2025-01-21阅读约需 12 分钟

【导读】就在刚刚，Verses团队研发的Genius智能体，在Pong中超越了人类顶尖玩家！而且它仅仅训练2小时，用了1/10数据，就秒杀了其他顶级AI模型。最近，Verses团队在AI领域投下了一枚…

2025-01-18阅读约需 8 分钟

新智元报道【新智元导读】清华大学团队在强化学习领域取得重大突破，开发出DSAC及DSAC-T系列算法，有效解决强化学习中的过估计问题，提升学习效果稳定性；团队还提出DACER算法，将扩散模型与在线强…

2025-01-18阅读约需 8 分钟

新智元报道【新智元导读】 OpenAI，有大事发生！最近各种爆料频出，比如OpenAI已经跨过「递归自我改进」临界点，o4、o5已经能自动化AI研发，甚至OpenAI已经研发出GPT-5？OpenAI…

2025-01-01阅读约需 17 分钟

这是大模型年终分享系列的第一篇，我们近期将陆续推出其他领域的项目合集，如视频生成、智能体（agent）等。希望对大家有所帮助，也请大家多多批评指正。图像生成，作为由人工智能（AI）大模型驱动的 AI…