一、李沐演讲:模型、产品部分“8月23日,李沐回到了母校上海交大,做了一场关于 LLM 和个人生涯的分享,整个分享干货满满。”1. 开场科普李沐将模型训练比作“炼丹”的过程,巧妙地将其分为三大要素:数据、算力和算法。
浏览:GPT-3.5
今年以来,越来越多AI巨头和投资机构宣布投资日本AI产业。4月15日,OpenAI首个亚洲办公室落地日本东京,并为日企提供日语版GPT-4。8月17日,a16z计划在日本开设第二家国际办事处,用于东京的融资活动。4月9日,微软宣布就云计算和AI领域,未来两年内在日本投资29亿美元。
比OpenAI最强的GPT-4o更快,函数调用能力与GPT-4相当,同时比它小N倍,且只需要一张卡来做推理。这是Nexa AI亮相时给大家带来的“冲击”。四个月前,Nexa AI开发的5 亿参数小模型…
存算一体架构已经为边端大模型部署提供了一种高效解决方案。大模型这把火,已经烧到了边端设备!一段时间以来,能更好适配手机、PC等边缘设备的端侧模型如雨后春笋般接连冒出,微软 、苹果、Hugging Fa…
康奈尔大学最近牵头,发起了一项关于AI幻觉的研究,结果让我非常有共鸣……平时处理业务、找人找信息、写东西……我自己用GPT-4o和Perplexity.AI的时间,大致是一半一半。但是,仍然发现,即便GPT已经浓眉大眼地列出了信息来源、网站链接,真的细看,照样可以驴唇不对马嘴。