2025-1-27 8:6
AI大模型早报#0127:特朗普官宣AI新政策、全球掀起DeepSeek复现狂潮
导读:今日头条是白宫官宣的特朗普新命令,旨在消除一切不利于AI发展的障碍。该命令撤销了阻碍AI创新的政策和指令,为美国保持AI领域的全球领先地位铺平道路。此举不仅体现了美国对AI发展的高度重视,还将在政策层面上为OpenAI等大项目提供强有力支持,对全球AI行业的格局和发展趋势产生深远影响。其次,全球掀起的DeepSeek复现狂潮也值得关注。该模型以低成本芯片训练出突破性AI,可能动摇OpenAI、Meta等公司的技术优势及高估值。此外,上海人工智能实验室、北京生命组学研究所和复旦大学团队联合研发的肽段测序模型π-PrimeNovo,显著提高了肽段测序的准确性和推理速度,这一成果标志着肽段测序技术的重大进展,有望在生物医学研究领域发挥重要作用。【前沿动态】白宫官宣!特朗普新命令,消除一切不利AI发展的障碍!摘要: 白宫宣布,特朗普发布新行政命令,旨在消除美国在AI领域领导地位的障碍。该命令撤销了之前阻碍AI创新的政策和指令,为美国在AI方面保持全球领先地位铺平道路。此举意在在政策层面上为OpenAI等大项目提供支持。命令包括撤销不利于AI发展的条款,制定AI行动计划,审查并调整与先前AI监管命令不符的政策,以确保美国的AI发展不受限制。此举显示美国决心大力发展AI并保持其在该领域的全球领导权。阅读详细内容 【模型训练】全球掀起DeepSeek复现狂潮,一文汇总!摘要: 全球掀起复现DeepSeek的热潮,该模型以低成本芯片训练出突破性AI,可能动摇OpenAI、Meta等公司的技术优势及高估值。DeepSeek将超强性能模型从算力巨头释放给每个人。HuggingFace团队已复刻DeepSeek并开源所有训练数据和脚本。此外,伯克利和港科大的团队也以极低成本成功复刻了DeepSeek,显示出该模型的广泛适用性和潜力,可能对AI行业产生深远影响。阅读详细内容【前沿动态】推理速度提升89倍!肽段测序π-PrimeNovo适用于宏蛋白质组学大规模应用摘要:上海人工智能实验室、北京生命组学研究所和复旦大学团队联合研发了一种基于非自回归transformer的肽段测序模型π-PrimeNovo。该模型解决了传统自回归模型存在的错误累积和推理速度慢的问题,通过双向信息集成和并发生成过程,显著提高了肽段测序的准确性和推理速度。在九物种基准测试集上,PrimeNovo的平均肽段召回率显著提升,达到64%,比先前的领先模型Casanovo V2提高了10%。此外,该模型在推理速度方面也有显著优势,比Casanovo V2快至89倍,特别适合大规模应用,如宏蛋白质组学。PrimeNovo还展现出在挖掘磷酸化肽和检测低丰度翻译后修饰方面的出色表现,标志着肽段测序技术的重大进展。阅读详细内容 【前沿动态】接棒DeepSeek!阿里千问宣布开源百万Token上下文模型:主打闪电般的推理「附送详细技术报告」摘要: 阿里通义千问团队宣布推出最新开源模型Qwen2.5-1M,该模型能够原生支持百万Token上下文长度,轻松处理超长文档、进行深度对话以及理解复杂任务。此外,团队还开源了基于vLLM的推理框架,集成稀疏注意力机制,使模型在处理百万Token输入时速度提升3-7倍。用户可通过技术报告深入了解模型细节,并在通义千问Chat平台、Hugging Face和Modelscope上体验或获取模型。这一创新提升了AI在实际应用场景的效率和体验。阅读详细内容 【行业落地】刷新AR/AI眼镜众筹纪录,CES上爆火的Halliday做对了什么?摘要: 1月25日,全球最大众筹网站Kickstarter上,AI眼镜品牌Halliday在72小时内募集超137万美元,创造AR/AI眼镜项目众筹新纪录。该眼镜在2025年CES上首度亮相,以35克的超轻重量、12小时长续航、时尚设计和创新的AI体验脱颖而出,受到微软、Meta、谷歌等科技巨头关注。其成功背后源于对用户需求的深刻洞察和与Gyges Labs的技术合作。Halliday重新定义了AI眼镜,注重日常佩戴舒适性和AI功能的隐秘性,为行业带来全新产品创新范式。阅读详细内容 【前沿动态】字节版Operator抢跑OpenAI? 直接免费开源, 网友:怒省200美元!摘要: 科技巨头OpenAI发布了智能体Operator,标志着AI智能体时代的到来。同时,字节跳动豆包大模型团队也公布了开源智能体UI-TARS,其名字来源于电影《星际穿越》的TARS机器人,预示高度智能和自主思考能力。UI-TARS不仅能控制浏览器和执行推理,还能操作显示在屏幕上的任何内容,包括手机和电脑。与Midscene.js结合,UI-TARS可支持目标驱动、兼容画布操作等,提升执行效率。此外,UI-TARS在权威基准测试中表现出色,未来有望在GUI智能体领域发挥重要作用,推动智能体时代的发展。阅读详细内容 【前沿动态】MV-DUSt3R+: 只需2秒!Meta Reality Labs开源最新三维基座模型,多视图摘要: Meta Reality Labs和伊利诺伊大学厄巴纳-香槟分校联合推出的MV-DUSt3R+,一种全新的3D场景重建技术。该技术能在2秒内从稀疏视图中快速重建复杂三维场景,通过多视图解码器块和交叉视图注意力块机制,实现了高效、准确且灵活的三维重建,无需相机校准和姿态估计,可处理任意数量视图。研究团队包括Meta高级科研研究员严志程和伊利诺伊大学博士生唐正纲等。实验结果显示,MV-DUSt3R+在效率和质量上显著优于传统方法,为实时三维场景重建在混合现实等领域的应用铺平了道路。阅读详细内容 【前沿动态】TeleAI “复杂推理大模型” 达竞赛级数学表现,评分超 o1-preview摘要: 中国电信人工智能研究院近日发布了复杂推理大模型TeleAI-t1-preview,该模型使用强化学习训练方法,大幅提升了在数学推导、逻辑推理等复杂问题的准确性。在权威数学基准评测中,其表现超越了OpenAI和GPT等标杆模型。TeleAI-t1-preview不仅能给出答案,还能完整呈现思考和分析过程,有助于学生深入理解题目逻辑。此外,该模型还能理解和解答古代数学经典著作中的题目。TeleAI采用了创新的训练策略,包括构建高质量推理数据集、训练评估模型、监督微调和强化学习等,以提高模型的逻辑推理能力和可解释性。阅读详细内容 【前沿动态】DeepSeek-R1持续刷屏,连Open R1都来了!抱抱脸发起,1天狂揽1.9k星摘要: 科技巨头HuggingFace发起Open R1项目,旨在复制并开源国产大模型DeepSeek-R1,包括其训练数据和脚本。该项目短短1天内在GitHub上获得1.9k标星,引发全球大模型圈震撼。HuggingFace计划分三步完成该项目:首先复制DeepSeek的蒸馏版模型,其次复制其纯强化学习pipeline,并通过多阶段训练过渡到RL版本。同时,OpenAI也坐不住了,剧透将推出o3-mini智能体给Plus会员。DeepSeek的开源力量正在搅动全球AI界。阅读详细内容 【模型训练】全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻摘要:近日,DeepSeek引起全球关注,UC伯克利、港科大等纷纷成功复现。该模型以极低成本训练出突破性AI,可能威胁美国AI霸权。DeepSeek表明,大模型比拼的不再是算力,而是开源与创新。研究人员在CountDown游戏中复现了DeepSeek R1-Zero,成本不到30美金,见证了「啊哈」时刻。他们通过强化学习,使基础语言模型能够自我验证和搜索。此外,港科大团队仅用8K样本在7B模型上复刻DeepSeek,取得令人惊喜的数学推理结果。这一系列成果显示,超强性能模型不再独属于算力巨头,开源与创新正引领AI进入新的分水岭。阅读详细内容 【前沿动态】Nat. Commun. | 中南大学研究团队提出基于电子构型的堆叠模型,推动新材料稳定性可靠预测摘要: 中南大学王建新教授团队提出了一种基于电子构型的机器学习框架,通过堆叠泛化集成不同领域知识的模型,准确预测化合物的热力学稳定性。该模型在实验中取得了0.988的AUC分数,且样本利用效率极高,仅需现有模型所用数据的七分之一。研究还展示了该框架在探索未知化学成分空间及发掘新材料方面的潜力,如二维宽带隙半导体和双钙钛矿氧化物。通过第一性原理计算验证,该方法在识别稳定化合物方面表现出色,为材料设计领域的研究提供了有力支持。阅读详细内容 【人物观点】NBC火爆专题: DeepSeek超越美国的AI突破,和PerPlexity创始人讨论摘要: 美国媒体关注中国AI公司DeepSeek的R1模型,该模型在发布后迅速引起关注,被认为可能威胁美国AI领域的主导地位。DeepSeek的开源模型在多项测试中超越市场现有模型,且研发成本低、耗时短。尽管受美国半导体限制,DeepSeek仍利用较低性能芯片实现了突破。DeepSeek的神秘背景和快速赶超引发行业对AI竞争格局的关注,挑战了OpenAI等公司的领先地位。阅读详细内容