AI大模型早报#0905:1000个智能体创建首个「AI文明」、清华EconAgent获ACL 2024杰出论文

AI大模型每日早报常政2024-9-5 7:55

导读:北大校友Robert Yang团队在虚拟世界中创建了首个由1000多个智能体构成的“AI文明”,这些智能体展现出类似人类社会的活动,形成独特的经济、文化体系,并能进行大规模合作。清华大学的研究团队则通过大语言模型构建智能体EconAgent,革新了计算经济学研究范式,模拟了真实经济个体的行为。同时,有关OpenAI崛起背后开放性探索的讨论,以及Ilya Sutskever的安全超级智能公司SSI完成10亿美元融资的消息,都凸显了AI领域对创新与安全的重视。 在技术应用方面,智源研究院推出了全球首个包含文生视频的模型对战评测服务,旨在促进大模型评测生态的发展。谷歌的研究揭示了大模型计数能力的问题,指出嵌入维度是关键因素。此外,AI证件照神器在GitHub上走红,以及“AI原住民”小学生利用大模型进行编程开发的新闻,都展示了AI技术在日常生活和教育领域的广泛应用。 最后,上海交通大学与哈工大深圳校区联合团队推出的“可进化游戏引擎”Delta-Engine,结合大模型与传统游戏引擎,为虚拟世界的自动演化和代码成长提供了新的可能。

标题: 1000个智能体创建首个「AI文明」!北大校友放弃MIT教职打造「西部世界」

摘要: 要点提炼: 1. 1000多个智能体在虚拟世界“我的世界”中创建了首个“智能体文明”,具备经济、文化、宗教和政府等结构。 2. 这些智能体是完全自主的个体,能利用工具和游戏实现目标,形成了交易市场和经济体系,以宝石作为货币。 3. 智能体开展了类似人类世界的活动,能够24小时无间断参与,且活动每天都有所不同,展现了大规模合作的能力。 4. 项目代号为“Sid”,由北大校友、MIT教授Robert Yang发起,Altera团队实现,使用GPT-4技术,智能体收集物品的能力远超其他AI。 5. 智能体被赋予不同角色,有类似人类的“生活”,能进行民主投票、传播宗教等,还可试玩游戏世界,其中Elon、T-2000、Katniss等智能体受欢迎。 6. Altera联创出教学视频,展示智能体如何帮助玩家,创始科学家Peter Wang称他们正在构建AI大脑,模拟人类特质。 7. Project Sid旨在探索构建由AI智能体组成的文明,最终将数字人无缝整合到人类社会中,实现真正自主的智能体。阅读详细内容 

标题: 清华EconAgent获ACL 2024杰出论文:大模型智能体革新计算经济学研究范式

摘要: 清华大学的研究团队凭借其论文《EconAgent: Large Language Model-Empowered Agents for Simulating Macroeconomic Activities》(论文地址)荣获了自然语言处理顶会ACL 2024的杰出论文奖。该研究通过利用大语言模型(LLM)构建智能体EconAgent,模拟了个体在宏观经济系统中的工作与消费行为。相比传统的基于代理的建模(ABM),这种方法涌现出了更稳定、真实的宏观经济现象。研究团队的成员包括李念、李勇教授、高宸助理研究员和廖庆敏教授。通过赋予智能体差异化的画像和对真实经济环境的感知能力,EconAgent能够综合考虑多类经济因素做出自主决策,有效模拟了真实经济个体的行为。此外,研究还探究了EconAgent的决策行为,验证了其与现实世界中人类行为的吻合度,并成功模拟了重要事件(如COVID-19)对宏观经济的影响。这一研究为宏观经济模拟提供了新的有效途径,展示了LLM在经济学领域的巨大潜力。阅读详细内容 

标题: 跟两位亲历者聊聊 OpenAI 崛起的关键:兴趣驱动的探索,而非目标导向的马拉松

摘要: 两位人工智能研究者认为,对于高远目标,开放性探索比计划更有效。他们合著的《为什么伟大不能被计划》提出这一观点。OpenAI的成功被视为目标导向,但实际上,其内部有许多开放性探索。例如,ChatGPT起初是边缘项目,却意外成功。研究者警告,仅依赖Scaling Law等计划可能走进死胡同,呼吁更多开放性探索。随着AI越来越强大,二人离开OpenAI,继续研究开放性命题,并创办基于开放性系统的公司。阅读详细内容 

标题: 刚刚,Ilya新公司官宣融资10亿美元!只有10名员工,继续坚信scaling law

摘要: 安全超级智能(SSI)公司完成10亿美元融资,由OpenAI前首席科学家Ilya Sutskever等联合创立,旨在开发安全的人工智能系统。投资机构包括a16z、红杉资本等,公司估值达50亿美元。尽管AI大模型公司盈利前景不明,但仍有投资者看好AI基础研究。SSI计划用资金购买算力、招聘人才,并与云提供商和芯片公司合作。Ilya离职OpenAI后专注新事业,SSI将安全和能力视为技术问题,力求通过技术突破确保AI安全。阅读详细内容 

标题: 智源研究院推出全球首个包含文生视频的模型对战评测服务

摘要: 智源研究院于2024年9月4日推出全球首个包含文生视频的模型对战评测服务——FlagEval大模型角斗场,该服务覆盖约40款大模型,支持四大任务的自定义评测,并率先开放移动端访问入口。评测采取匿名机制,引入主观倾向阶梯评分体系,以提供更精确的模型性能差异。该服务还优化了用户交互体验,并将形成角斗场榜单公示模型能力。智源研究院持续迭代FlagEval评测体系,旨在促进大模型评测生态的发展。用户可通过移动端或官网体验模型对战。阅读详细内容 

标题: 谷歌揭秘大模型不会数r原因:嵌入维度是关键,不止分词器问题摘要: 谷歌新研究发现,大模型不会数数的原因并非仅是分词器问题,而是嵌入维度不足所致。当词汇量超过嵌入维度时,模型计数准确率显著下降。研究通过两个实验验证了这一结论,并指出增加Transformer层数可能带来的影响尚未探究。该研究为大模型计数能力划定了上下界,但界限尚不够紧致,需进一步验证。阅读详细内容 

标题: AI证件照神器登GitHub热榜,内置考研考公签证模版一键生成

摘要: AI证件照神器HivisionIDPhotos在GitHub(地址)上走红,由西安电子科技大学博士生林泽毅开发,能实现一键生成证件照,支持考研、考公等多种模版。该神器可更换背景、轻量级抠图,且提供了API服务和Docker部署。目前,项目已获3.2K星标,用户可上传照片制作证件照,但完全从随手拍到证件照还待完善。林泽毅计划添加美颜和换装功能,此前他的算法已在国内被近百万人使用。此次选择开源,是因为他认为证件照制作这个场景已有些过时,当年曾有线上海马体的想法。阅读详细内容 

标题: 第一批“AI原住民”小学生,正在用大模型搞开发

摘要: 第一批“AI原住民”小学生利用大模型进行编程开发,通过小程序解决日常问题,体验编程乐趣。大模型在编程教育中的应用引发热议,有人认为其将颠覆传统编程,而有人持保留意见。微信小程序教育平台将编程教育与小程序结合,通过大模型降低编程门槛,激发学生创造力。全球多所学校参与小程序编程挑战赛,展现AI与编程教育的融合成果。阅读详细内容 

标题: 上交大推出“可进化游戏引擎”!大模型加持代码自动成长,虚拟世界演化无需预设

摘要: 上海交通大学与哈工大深圳校区联合团队推出了“可进化游戏引擎”Delta-Engine,结合大模型与传统游戏引擎,能自动成长出新的代码,让虚拟世界能够演化且无需预设(论文地址)。该引擎由基座引擎和代理模型构成,通过增量预测实现高效拓展。研究团队基于该引擎打造了概念游戏Delta-Pokémon,玩家可DIY专属宝可梦,实现开放角色扮演游戏(ORPG)的设想,满足玩家对自我的表达。阅读详细内容