Home黄钊的AI日报·第一季
黄钊的AI日报·第一季

黄钊的AI日报·第一季

@hanniman

1、每天5条AI内容点:不是常见的新闻汇总模式,而是站在AI产品经理视角,提炼干货认知、展示“what I see”。

2、已在社群“AI产品经理大本营”里,运营5个月之久,用户口碑极佳。

3、90元/季度,持续日更至11月30日。可“免费预览(试读)”五份示例。

一份快餐的价格,3个月的精神食粮,还等什么呢,点击下方“购买”入口吧:)

【重要】温馨提示:添加小助理乐乐微信,不仅能咨询任何使用问题,还可免费领取hanniman独家整理的“AI季度资料包”。(加v:lelegirl721,备注“小报童”)
订阅234
文章100
最后更新:2023-11-30 12:16
查看 【黄钊的AI日报·第一季】 详情查看 【hanniman】 主页
分享到微信打开

免费内容

2023-8-29 9:25

【AI日报_20230829】

1、【重要】【产品视角】如何理解 Chracter.ai 和 Pi 的用户需求a)用户在频繁发问时,他们只是在测试AI的能力。但当用户开始大段地倾诉时,你的机器人就开始真正满足「情感陪伴」的需求了,而用户倾诉的情绪,大都是不太好的情绪。b)小冰后台中,AI被霸凌的比例是很高的,人一定会有负面情绪、负面情绪一定要散发出去……负能量到小冰这,系统不会真的委屈,因此人类的负能量到这里,算是画上了一个句号。c)相比匹配对的人,Pi在试图直接成为对的人。也就是说,它做的不是平台/渠道,而是供给。d)社交劣势人群服务:提供无差别情感反馈,让人放下自我意识的负担。e)私密负向情绪疗愈:隐私性强,可消化人性的恶,并提供稳定反馈。f)表达ROI非常高:用户对Pi的表达成本极低,却不会影响反馈质量,非常适合时间精力紧缺的的情况下进行情感宣泄。 2、【最新案例】图片中生成文字的应用Ideogram:大牛团队,图片中生成文字效果非常好,未来可能会和Midjourney组成海报设计组合工具。3、【资源/工具】ControlNet原班人马制作的AI生图工具「Fooocus」,免费、本地部署,配置要求低、操作简单,两周前在Github上已开源。 4、【行业动态】LLM训练产业全景图5、【行业动态】稚晖君:具身智能即将为通用机器人补全最后一块拼图a)具身智能的四个核心要素:第一,本体,作为实际的执行者,是在物理或者虚拟世界进行感知和任务执行的机构。第二,智能体(Embodied Agents),是具身于本体之上的智能核心,负责感知、理解、决策、控制等的核心工作。第三,数据。涉及机器人的数据稀缺且昂贵。第四,学习和进化架构。b)谷歌在具身智能的研究上更具有广泛性和延续性。其一,有13万条机器人真实数据数据;其二,它的预测映射到机器人的动作结果处于高级别设计层级。c)智元机器人提出具身智脑EI-Brain的概念(Embodied Intelligence Brain),该系统将机器人的具身智能思维系统分为四层,分别是云端的超脑、端侧的大脑、小脑和脑干。----温馨提示----当前早鸟价“60元/季度”,9月6日恢复原价“90元/季度”;升级到“AI产品经理大本营”社群会员,可抵扣60元,详见专栏介绍链接:https://xiaobot.net/p/ai01

2023-8-28 8:35

【AI日报_20230828】

1、【重要】【产品视角】AI浪潮下,个体户的机会、模式与风险a)AI是打深井式纵向挖掘,不管场景大小,AI需要从头到尾整合完才能创造价值。i,比如做招聘的数字员工,如果不能把招聘全场景完全覆盖,就不创造超于正常员工的价值。ii,这是一条指数曲线,产品的价值在跨过某个阈值(拐点)才会一下子翻上去。而如果打井不出水,会渴死做对应产品的人。b)AI会带来长尾领域“屁胡”的机会。i,通过开源、通用大模型和互联网基础设施,个人或小团队可以创造出长尾产品。ii,但要真的解决没人解决的、也切实存在的问题。开源相当于把打井工具给免费了,5米的井,它给你先打出3米;剩下的,需要你的眼光,看哪里容易出水,然后使劲磕下。iii,过去的投资,是赚股份出让的钱,以后可能不行了。或者就OpenAI那样,早期赚的钱大比例优先给投资方,到一定额度投资方就退了,剩下的人继续赚后面的钱。从组织的稳定性上,这种小团队最适合的是郭德纲于谦模式,赚钱就平分。iv,更关键的是,对人的要求发生了变化。过去大分工体系下,需要分工后的专业性,以后则需要综合上的专业性——能基于方块的原材料,干出最后的圆或者其它什么形状。例子是Midjourney十几个人年入近亿美金、是之前的Instgram。甚至,AI时代打井的时候,忌讳人多。hanniman评注:要自己能run一个系统,有独立操盘的能力,对人的要求高了一个维度。具体可以看我这个系列:「AI时代超级个体系列(2)_第二个 10 倍:团队_20230721 https://t.zsxq.com/11hOWEmTx 」c)长尾区域的高频抖动,导致这类产品未必能作为长久的事业。i,很多长尾机会点会被相关的给吞掉,过去pdf转换是个很赚钱的独立工具,后来很多工具都提供了这个功能。这是吞噬。ii,同一个位置,机会空间不会有那么多。iii,这反向决定了策略——要极为灵活,快速行动,差不多了能卖就卖了。不要在不能贪婪的时候贪婪。hanniman评注:之前我一直说,站在长期视角,纯工具类应用不是好的方向;但今天说的是,能赚快钱其实也挺好,就卖短期工具——如果你擅长(基因)的话。 2、【重要】【最新案例】超高清无痕AI生成广告(30秒视频):几乎找不到破绽的AI生成视频,作者使用Midjourney生成图片后,使用Runway和Pika Labs生成视频剪辑,最后使用Topaz提升图像的清晰度。3、【行业动态】Perplexity针对新的GPT-3.5 fine-tuning API进行了实践落地a)不仅提高了速度,降低了成本,并且达到了GPT-4的性能。b)模型延迟减少了4-5倍,平均在0.65秒内提供结果,而不是3.15秒(FT-GPT-3.5与GPT-4相比)。c)原链接需科学上网:https://twitter.com/perplexity_ai/status/16951029953257104844、【技术视角】2D和3D数字人技术路线和当前效果对比a)数据形式:2D真人数字人的数据形式是图像或视频,现有的技术中对于图像、视频的编辑或生成相比于3D数字人更加成熟。b)在真实性上2D方法效果更好,在可驱动性上3D方法表现更好。c)评估数字人技术的关键指标是可驱动性和真实性,相关技术将朝着真实性和可驱动性共赢的方向发展。 5、【最新案例】Midjourney V5.2艺术家提示词Patrick Nagel----温馨提示----当前早鸟价“60元/季度”,9月6日恢复原价“90元/季度”;升级到“AI产品经理大本营”社群会员,可抵扣60元,详见专栏介绍链接:https://xiaobot.net/p/ai01

2023-8-27 8:35

【AI日报_20230827】

1、【重要】【深度认知】AI应用创业的共识与非共识a)大胆猜测:中国的企业级软件市场,可能会跨越SaaS阶段,直接迈向AI Agents阶段。b)通用大模型的创业窗口已经关闭了,接下来的重点是AI应用/infra/agents。c)业务比融资重要,与其把时间花在融资上,不如把重心放在业务和客户身上。从阶段上看,国内可能不缺投种子的,但陆奇到朱啸虎中间没有接盘侠,这是最尴尬的。d)80%以上的企业级软件80%以上的销售增长靠SLG,目前SLG还是主流。所谓:超大B靠集成、大B靠直客,中B靠代理,小B可放弃。其中,客单价决定了业务增长和销售方式。e)人类与AI协同的三种模式2、【重要】【资源/工具】ElevenLabs:在线AI模拟真人TTS工具,支持包含中文在内的28种语言的a)功能1:Speech Synthesis 语音合成器,多种语言合成真人语气&逻辑语音。b)功能2:VoiceLab 声音实验室,从头设计自己需要的声音。c)功能3:Voice Library 声音库,有很多用户创建语音的声音社区。d)免费版支持无商业许可下的每月一万字、三个自定义声音、API调用。e)官网在:https://elevenlabs.io/ 3、【最新案例】以更可控的方式写剧本:以刘姥姥一进荣国府的故事为背景,用大模型扩写刘姥姥在荣国府门口摆地摊,以曲线进入荣国府的剧情。4、【行业动态】Meta发布Code Llama,软件开发迎来智能化范式转换拐点a)将大模型的代码能力开源,性能表现非常强悍 ,且可免费用于研究和商业用途。b)支持三种版本:基础代码模型、Python专用代码模型和针对自然语言指令进行微调的Instruct模型。c)大模型将为软件开发带来三大范式转换:5、【技术视角】如何在一块性能有限的老破小GPU显卡成功运行模型----温馨提示----当前早鸟价“60元/季度”,9月6日恢复原价“90元/季度”;升级到“AI产品经理大本营”社群会员,可抵扣60元,详见专栏介绍链接:https://xiaobot.net/p/ai01

2023-8-26 9:35

【AI日报_20230826】

1、【重要】【产品视角】如何理解Character.ai 和 Pi 的用户需求a)c.ai、Pi、replika,代表着三个不一样的用户需求:角色扮演、情感陪伴、荷尔蒙宣泄。b)角色扮演:IP即内容。本质是通过「故事」构造架空世界,并使用户产生「代入感」,核心是 fantasy(幻想)。i,玩原神上头叫老婆的、小时候看西游记上头爬上房梁的,都是fantasy. 这是人们对世界的美好寄托,是一个普世需求。ii,要产生fantasy,第一步就是要有好故事——在中国市场上以三种产品形式呈现:长视频、小说和RPG游戏。iii,c.ai 就是IP的下游产业,通过对IP的深度模拟,将在故事中静态的IP动态化,满足用户的fantasy——这是一个明确且巨大的用户需求,且在合适产业链位置中充分发挥了AI的能力。c)为什么说c.ai是角色扮演i,首先,c.ai用户都是冲着游戏、动漫角色去的(70%的互动),无IP角色(如心理医生、写作助手、面试官、游戏玩家等)仅占互动数的5%。ii,从追星逻辑出发,粉丝诉求并不是与明星私人的近距离接触,而是希望明星本人能获得收益/成长(养成妈妈粉),或从粉丝社群中获得社交和充实感(粉丝社群),c.ai在这套逻辑下没切中核心需求。iii,其次,针对这些IP,用户主要需求是「基于角色设定的角色扮演」(占比66%,其中40%为「爱情角色扮演」,另外26%为「冒险角色扮演」)。iv,不少用户提出,想要在一定的故事情节下,攻略角色的感情,这也是c.ai的进一步升级方向 —— 在IP的下游中进行故事再创作。v,综上,c.ai的核心是「好IP」 + 「好模拟」。即,c.ai类的产品,生命线是在上游IP生产厂商的手里的,如今创业公司的优势仅有模型能力。d)引申阅读,之前我的这篇「虚拟陪伴AI,要想真正建立情感链接,这3个备选路径,可能只有最后一个能走通_20230512 https://t.zsxq.com/11G7gnKOg 」 2、【重要】【资源/工具】2款可平替SD的免费AI绘画工具a)无界AI:界面会更加专业,有众多大模型可选(包括ControlNet),分辨率也可自选,但缺点是生成图片需要积分,分辨率越高需要的积分越高(免费送200积分,很快会用光)。不过可以将你的提示词拿去换(卖)积分;此外,只要作品优秀,还可以申请创作者计划,一副作品可以卖200元左右。b)WHEE,美图每天100张免费图片额度,不耗费积分,还可附加Lora,调节相关参数,唯一缺点是分辨率不可选,ControlNet功能有、但稍微偏少。教程在这里。 3、【重要】【最新案例】AGI 大会 DemoShow,路演团队现场视频(下) 4、【行业动态】百度出品的AI编程助手ComateComate(Coding Mate Powered by AI),目前在申请试用阶段a)主要功能有:代码解释、技术问答、实时续写、注释生成代码、生成函数注释与行间注释、生成单元测试、代码优化、代码修复b)编程语言支持:C/C++、Java、Python、Go、JavaScript、TypeScriptc)常用IDE支持:VS Code、IntelliJ IDEA、GoLand、PyCharm、WebStorm、CLion、PhpStorm、Android Studio、Xcode、iCoding等。 5、【技术视角】AI模型测评代码—GhostReview(Stable Diffusion)----温馨提示----当前早鸟价“60元/季度”,9月6日恢复原价“90元/季度”;升级到“AI产品经理大本营”社群会员,可抵扣60元,详见专栏介绍链接:https://xiaobot.net/p/ai01

2023-8-25 7:37

【AI日报_20230825】

1、【重要】【产品视角】AI 大模型的下一步,或许是 Google 早年的那种便宜方案a)用软件换来的硬件的巨大成本优势,是 Google 早期成功不可忽略的因素。这段历史,会对现在的 AI 格局有所启发?b)当年,Google没有买当时唯一正确的几万美金一台的高端服务器,而是在软木纸上,放上四小片主板、绑上硬盘、插上网卡;然后用软件,做了Google File System 分布的文件系统、在加上自己的 MapReduce 的框架,把计算可以分布(map)在这些小电脑上,然后把结果汇总(Reduce)……因为硬件便宜、算力足、存储便宜,这才足以支撑 PageRank 这样的巨大算力消耗,Google很快就从 Stanford 的一个无名小站,打败了当时的巨头(Lycos,AltaVista,InfoSeek)。c)现在,用 Nvdia a100 的显卡堆出来的ChatGPT,固然帮助我们完成了第一步(从看不到可能性,到证明了可能性),就如同 Lycos 搭起来的昂贵的搜索引擎服务一样。但,是不是有 Google 这样的方式,用软件的方式疯狂的降低硬件成本的可能性呢? 2、【行业动态】Midjourney更新了very region(局部重绘)功能,相当于结合AI版的Photoshop和SD功能。3、【重要】【技术视角】大模型研发核心:数据工程、自动化评估及与知识图谱的结合a)现有大模型基本情况:分散在3个层级内,i)“买票乘坐”,包含有 GPT-4、 PaLM 等,提供API调用;ii)私有部署,包含有Flan-T5、Pythia等;iii)平民玩法,做一些领域微调得到一个私有部署模型,包含有Alpaka、Koala等。b)现有大模型应用场景:S(阅读理解);M(语言学的解题或者情感分析、GRE考试)、L(语音或者推理的任务);XL(高考题或者其他一些更先进的工作);Next...(偏向于落地,解决更长文本的处理等问题)c)中/英文主流大模型常用预训数据差别较大:i)英文:维基百科、书籍、论文期刊、WebText、Conmmon Crawl、The Pile及代码、论坛等;ii)中文:开源的评测数据、百科的三元组、社区QA、论坛讨论、Common Crawl等。 4、【行业动态】国内首个数学领域千亿级大模型MathGPT开启内测 by 好未来a)通过文字或图片上传数学题,即可得到对话式的解答反馈b)目前支持中文、英文版本的PC端和移动端体验,在部分数据集上有不错的表现。c)申请内测入口详见官网链接。5、【资源/工具】吴恩达 LLM finetune 新教程发布:详见deeplearning官网链接(需科学上网)。----温馨提示----当前早鸟价“60元/季度”,9月6日恢复原价“90元/季度”;升级到“AI产品经理大本营”社群会员,可抵扣60元,详见专栏介绍链接:https://xiaobot.net/p/ai01