2025-2-4 15:51
AI大模型早报#春节版:假期不能错过的10大新闻
导读:朋友们好,2025年春节长假即将结束,为帮助大家从容应对接下来的AI世界,《AI大模型每日早报》特别推出“春节版”,用自研的爬虫和LLM处理程序,阅读、分析了春节假期前7日149篇AI大模型相关的资讯,精选出10篇不容错过的新闻分享给大家。祝大家:新春快乐,蛇来运转![1] DeepSeek重创美国芯片产业,英伟达一夜蒸发6000亿!巨头破防,美股历史性崩盘推荐理由:DeepSeek发布突破性AI模型引发美股科技股崩盘,这一事件显示了中国开源AI大模型对全球金融市场的影响力,对于理解AI技术的经济影响至关重要。摘要: 除夕日,科技股全线崩盘,英伟达股价暴跌17%,市值一夜减少近6000亿美元,创下单公司史上最大市值损失纪录,CEO老黄个人资产缩水210亿美元。此次暴跌源于DeepSeek以低成本建立突破性AI模型,引发市场对AI行业巨额投入的质疑。微软CEO纳德拉认为,随着AI变得更高效廉价,其使用量将激增。同时,AI大牛Karpathy强调,开发前沿LLM仍需大规模GPU集群,算力决定智能上限。恐慌情绪下,投资者开始重新评估科技股,避险资产成为新选择。阅读详细内容 [2] Sam Altman炸场东京,亲曝GPT-5研发路线图,多模态能力颠覆传统推荐理由:GPT-5研发路线图的透露信息,这对于了解AI大模型的未来发展方向至关重要。摘要: 2月3日,OpenAI联合创始人兼CEO Sam Altman在东京大学活动中透露了GPT-5的研发路线图。GPT-5将是一个超级混合模型,整合GPT和o系列模型,支持视频、音频、图像的多模态交互。GPT-5将在语言理解和生成能力上有显著提升,具备更精确的理解精度和表达多样性。此外,OpenAI致力于降低AI使用成本,推动教育应用,并计划开发新AI设备,满足用户不同场景需求。同时,OpenAI强调AI伦理准则的重要性,倡导全球对话,建立广泛认可的伦理规范。阅读详细内容 [3] OpenAI上线Deep Research!人类终极考试远超DeepSeek R1推荐理由:AI领域的一个重要进展,标志着AI在自我发现新知识阶段的应用。摘要: 2月3日,OpenAI发布了新的智能体产品「Deep Research」,专为深度研究领域设计。该产品能综合大量在线信息,完成多步骤研究任务,帮助用户进行深入复杂的信息查询与分析。Deep Research现已对Pro用户开放,并将逐步向Plus和Team用户开放。它能在ChatGPT中快速完成人类需数小时才能完成的工作,标志着OpenAI向开发AGI的更广泛目标迈进。Deep Research通过搜索网络并综合知识成研究论文,展现了AI自我发现新知识的能力。该产品适用于金融、科学、政策等领域,可加快复杂网络研究,释放用户时间。与GPT-4o相比,Deep Research更适合深度和细节查询。它通过端到端的强化学习训练,在多个领域展现了出色的浏览和推理能力。阅读详细内容 [4] AGI时代,财富大洗牌!Hinton分解未来财富流向,普通人何去何从推荐理由: 讨论AGI时代财富流向和社会结构变化,这是关于AI社会影响的重要话题,对政策制定者和公众都有重要意义。摘要: 随着AGI/ASI的发展,智能系统将颠覆人类社会,可能导致贫富差距加大,社会结构巨变。专家如Hinton预测,AGI将取代人类劳动力,加剧社会不平等。尽管AI可能带来生活质量的提升,但就业市场将面临挑战,如CS毕业生就业难度增加。AGI/ASI的发展可能促进科学发现和太空探索,但也存在失去控制的风险。专家警告,需关注AI对社会的深远影响,并探讨如何控制其结果。阅读详细内容 [5] o3-mini发布!奥特曼:在开源上OpenAI一直站在历史错误的一边推荐理由:这篇资讯报道了OpenAI发布的o3-mini推理模型,包括其版本、价格、性能等方面的信息,以及因为DeepSeek R1产生的对于开源策略的理念改变,这也对于OpenAI产品未来沿革具有重要参考意义。摘要: 2月1日,OpenAI官方发布了最新推理模型o3-mini,包含low、medium和high三个版本,该模型系列中最新、成本效益最高,已上线ChatGPT和API。ChatGPT免费版用户可通过「Search+Reason」试用。o3-mini价格比o1便宜92.7%,目前不支持视觉功能。发布后,OpenAI团队进行了公开答疑,涉及思维tokens展示、模型权重和研究发布、完整版o3发布时间、语音模式更新等问题。性能报告显示,o3-mini在STEM推理方面优化,响应速度更快,准确率更高,错误率减少。同时,o3-mini在安全响应方面进行了审慎对齐训练,显著超越了GPT-4o。阅读详细内容 [6] 阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏推荐理由:阿里巴巴发布Qwen2.5-Max模型,超越DeepSeek V3,这表明AI大模型领域的竞争激烈和快速进步,对于跟踪行业发展趋势具有指导意义。摘要:阿里巴巴在除夕夜发布了Qwen2.5-Max模型,该模型在多个基准测试中超越DeepSeek V3,展示了卓越的性能。Qwen2.5-Max是一种超大规模MoE模型,经20万亿token的预训练数据训练。其多模态能力包括联网搜索、代码创作、小应用开发等,如一句话开发小游戏。模型已在Qwen Chat上线,可通过Hugging Face Demo、Any Chat和阿里云服务体验。阅读详细内容[7] 一夜之间,微软、英伟达、亚马逊全部接入DeepSeek!吴恩达:中国AI正在崛起推荐理由:报道了美国云计算平台对中国AI公司DeepSeek的R1模型的积极态度,以及中国AI的崛起对美国的影响。摘要: 微软、英伟达、亚马逊等美国云计算平台纷纷拥抱中国AI模型DeepSeek R1,显示了中国AI技术的全球影响力。DeepSeek的创新能力受到吴恩达和英特尔前CEO的赞赏。DeepSeek-R1不仅开源了模型权重,还分享了技术报告,推动了AI技术的开放与普及。同时,DeepSeek的成功也引发了关于AI技术地缘政治影响的讨论。此外,DeepSeek带来的启示包括计算资源的广泛利用、工程应对约束的本质以及开放的重要性。阅读详细内容 [8] DeepSeek除夕狂飙大招:开源多模态掀翻全场!256张A100训两周碾压DALL-E 3推荐理由:这是AI领域的一个重要创新,因为它实现了理解与生成的统一,对于多模态AI的发 展具有推动作用。摘要: DeepSeek在除夕发布了多模态大一统开源模型Janus-Pro,该模型集理解与生成于一体,已完全开源。Janus-Pro采用创新性自回归框架,实现了多模态理解与生成的统一,是对去年发布的前代模型Janus的全面升级。新模型通过视觉编码解耦克服了先前方法的局限性,提升了框架灵活性,同时显著提高了多模态理解和文生图能力。DeepSeek在训练上使用了非常少的算力,1.5B和7B两款模型分别只用了128颗和256颗英伟达A100训练一周和两周。此外,Janus-Pro在训练策略、数据规模和模型容量三个维度上都实现了重要突破,展示了视觉编解码方法的可扩展性,并在多个基准测试中取得了显著进展。阅读详细内容 [9] OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评推荐理由:DeepSeek的技术突破得到AI领域领军人物的认可,显示了中国AI技术的独立创新能力,对全球AI竞争格局产生冲击。摘要:DeepSeek发布的两个AI模型DeepSeek-V3和DeepSeek-R1以低成本实现高性能,引发市场对AI硬件需求担忧,恐影响英伟达高端芯片需求。DeepSeek在硬件受限下走出独特技术路线,得到AI领军人物肯定。OpenAI首席研究官Mark Chen表示,外界对DeepSeek成本过于夸大,OpenAI将继续在算力上投入,并预告今年将发布更好模型。AI市场竞争激烈,DeepSeek在新一年的发展值得观察。阅读详细内容[10] 美国人下载DeepSeek,最高判20年监禁?美国下令全面封杀中国AI推荐理由:美国准备对中国AI模型的全面封杀,反映了中美在AI领域的激烈竞争和地缘政治的紧张态势,对全球AI技术的发展和合作产生深远影响。摘要:美国国会立法全面禁止中国先进AI模型DeepSeek,下载者最高可判20年监禁。美国国防部、国会、海军、NASA及德州已禁止在官方设备上使用DeepSeek。新法案提出禁止从中国进口AI模型,中美AI领域彻底脱钩。法案若通过,将对AI研究产生重大影响,引发国内外热议。阅读详细内容