赶在放假前,支棱起来的国产 AI 大模型厂商井喷式发布了一大堆春节礼物。前脚 DeepSeek-R1 正式发布,号称性能对标 OpenAI o1 正式版,后脚 k1.5 新模型也正式登场,表示性能做到满血版多模态 o1 水平。
浏览:强化学习
【导读】就在刚刚,Verses团队研发的Genius智能体,在Pong中超越了人类顶尖玩家!而且它仅仅训练2小时,用了1/10数据,就秒杀了其他顶级AI模型。最近,Verses团队在AI领域投下了一枚…
新智元报道【新智元导读】 清华大学团队在强化学习领域取得重大突破,开发出DSAC及DSAC-T系列算法,有效解决强化学习中的过估计问题,提升学习效果稳定性;团队还提出DACER算法,将扩散模型与在线强…
新智元报道【新智元导读】 OpenAI,有大事发生!最近各种爆料频出,比如OpenAI已经跨过「递归自我改进」临界点,o4、o5已经能自动化AI研发,甚至OpenAI已经研发出GPT-5?OpenAI…
这是大模型年终分享系列的第一篇,我们近期将陆续推出其他领域的项目合集,如视频生成、智能体(agent) 等。希望对大家有所帮助,也请大家多多批评指正。图像生成,作为由人工智能(AI)大模型驱动的 AI…