小报童 - 黄钊的AI日报·第一季

1、每天5条AI内容点：不是常见的新闻汇总模式，而是站在AI产品经理视角，提炼干货认知、展示“what I see”。

2、已在社群“AI产品经理大本营”里，运营5个月之久，用户口碑极佳。

3、90元/季度，持续日更至11月30日。可“免费预览（试读）”五份示例。

一份快餐的价格，3个月的精神食粮，还等什么呢，点击下方“购买”入口吧：）

【重要】温馨提示：添加小助理乐乐微信，不仅能咨询任何使用问题，还可免费领取hanniman独家整理的“AI季度资料包”。（加v：lelegirl721，备注“小报童”）

【AI日报_20230829】

1、【重要】【产品视角】如何理解 Chracter.ai 和 Pi 的用户需求a）用户在频繁发问时，他们只是在测试AI的能力。但当用户开始大段地倾诉时，你的机器人就开始真正满足「情感陪伴」的需求了，而用户倾诉的情绪，大都是不太好的情绪。b）小冰后台中，AI被霸凌的比例是很高的，人一定会有负面情绪、负面情绪一定要散发出去……负能量到小冰这，系统不会真的委屈，因此人类的负能量到这里，算是画上了一个句号。c）相比匹配对的人，Pi在试图直接成为对的人。也就是说，它做的不是平台/渠道，而是供给。d）社交劣势人群服务：提供无差别情感反馈，让人放下自我意识的负担。e）私密负向情绪疗愈：隐私性强，可消化人性的恶，并提供稳定反馈。f）表达ROI非常高：用户对Pi的表达成本极低，却不会影响反馈质量，非常适合时间精力紧缺的的情况下进行情感宣泄。 2、【最新案例】图片中生成文字的应用Ideogram：大牛团队，图片中生成文字效果非常好，未来可能会和Midjourney组成海报设计组合工具。3、【资源/工具】ControlNet原班人马制作的AI生图工具「Fooocus」，免费、本地部署，配置要求低、操作简单，两周前在Github上已开源。 4、【行业动态】LLM训练产业全景图5、【行业动态】稚晖君：具身智能即将为通用机器人补全最后一块拼图a）具身智能的四个核心要素：第一，本体，作为实际的执行者，是在物理或者虚拟世界进行感知和任务执行的机构。第二，智能体（Embodied Agents），是具身于本体之上的智能核心，负责感知、理解、决策、控制等的核心工作。第三，数据。涉及机器人的数据稀缺且昂贵。第四，学习和进化架构。b）谷歌在具身智能的研究上更具有广泛性和延续性。其一，有13万条机器人真实数据数据；其二，它的预测映射到机器人的动作结果处于高级别设计层级。c）智元机器人提出具身智脑EI-Brain的概念（Embodied Intelligence Brain），该系统将机器人的具身智能思维系统分为四层，分别是云端的超脑、端侧的大脑、小脑和脑干。----温馨提示----当前早鸟价“60元/季度”，9月6日恢复原价“90元/季度”；升级到“AI产品经理大本营”社群会员，可抵扣60元，详见专栏介绍链接：https://xiaobot.net/p/ai01

【AI日报_20230828】

1、【重要】【产品视角】AI浪潮下，个体户的机会、模式与风险a）AI是打深井式纵向挖掘，不管场景大小，AI需要从头到尾整合完才能创造价值。i，比如做招聘的数字员工，如果不能把招聘全场景完全覆盖，就不创造超于正常员工的价值。ii，这是一条指数曲线，产品的价值在跨过某个阈值（拐点）才会一下子翻上去。而如果打井不出水，会渴死做对应产品的人。b）AI会带来长尾领域“屁胡”的机会。i，通过开源、通用大模型和互联网基础设施，个人或小团队可以创造出长尾产品。ii，但要真的解决没人解决的、也切实存在的问题。开源相当于把打井工具给免费了，5米的井，它给你先打出3米；剩下的，需要你的眼光，看哪里容易出水，然后使劲磕下。iii，过去的投资，是赚股份出让的钱，以后可能不行了。或者就OpenAI那样，早期赚的钱大比例优先给投资方，到一定额度投资方就退了，剩下的人继续赚后面的钱。从组织的稳定性上，这种小团队最适合的是郭德纲于谦模式，赚钱就平分。iv，更关键的是，对人的要求发生了变化。过去大分工体系下，需要分工后的专业性，以后则需要综合上的专业性——能基于方块的原材料，干出最后的圆或者其它什么形状。例子是Midjourney十几个人年入近亿美金、是之前的Instgram。甚至，AI时代打井的时候，忌讳人多。hanniman评注：要自己能run一个系统，有独立操盘的能力，对人的要求高了一个维度。具体可以看我这个系列：「AI时代超级个体系列（2）_第二个 10 倍：团队_20230721 https://t.zsxq.com/11hOWEmTx 」c）长尾区域的高频抖动，导致这类产品未必能作为长久的事业。i，很多长尾机会点会被相关的给吞掉，过去pdf转换是个很赚钱的独立工具，后来很多工具都提供了这个功能。这是吞噬。ii，同一个位置，机会空间不会有那么多。iii，这反向决定了策略——要极为灵活，快速行动，差不多了能卖就卖了。不要在不能贪婪的时候贪婪。hanniman评注：之前我一直说，站在长期视角，纯工具类应用不是好的方向；但今天说的是，能赚快钱其实也挺好，就卖短期工具——如果你擅长（基因）的话。 2、【重要】【最新案例】超高清无痕AI生成广告（30秒视频）：几乎找不到破绽的AI生成视频，作者使用Midjourney生成图片后，使用Runway和Pika Labs生成视频剪辑，最后使用Topaz提升图像的清晰度。3、【行业动态】Perplexity针对新的GPT-3.5 fine-tuning API进行了实践落地a）不仅提高了速度，降低了成本，并且达到了GPT-4的性能。b）模型延迟减少了4-5倍，平均在0.65秒内提供结果，而不是3.15秒(FT-GPT-3.5与GPT-4相比)。c）原链接需科学上网：https://twitter.com/perplexity_ai/status/16951029953257104844、【技术视角】2D和3D数字人技术路线和当前效果对比a）数据形式：2D真人数字人的数据形式是图像或视频，现有的技术中对于图像、视频的编辑或生成相比于3D数字人更加成熟。b）在真实性上2D方法效果更好，在可驱动性上3D方法表现更好。c）评估数字人技术的关键指标是可驱动性和真实性，相关技术将朝着真实性和可驱动性共赢的方向发展。 5、【最新案例】Midjourney V5.2艺术家提示词Patrick Nagel----温馨提示----当前早鸟价“60元/季度”，9月6日恢复原价“90元/季度”；升级到“AI产品经理大本营”社群会员，可抵扣60元，详见专栏介绍链接：https://xiaobot.net/p/ai01

【AI日报_20230827】

1、【重要】【深度认知】AI应用创业的共识与非共识a）大胆猜测：中国的企业级软件市场，可能会跨越SaaS阶段，直接迈向AI Agents阶段。b）通用大模型的创业窗口已经关闭了，接下来的重点是AI应用/infra/agents。c）业务比融资重要，与其把时间花在融资上，不如把重心放在业务和客户身上。从阶段上看，国内可能不缺投种子的，但陆奇到朱啸虎中间没有接盘侠，这是最尴尬的。d）80%以上的企业级软件80%以上的销售增长靠SLG，目前SLG还是主流。所谓：超大B靠集成、大B靠直客，中B靠代理，小B可放弃。其中，客单价决定了业务增长和销售方式。e）人类与AI协同的三种模式2、【重要】【资源/工具】ElevenLabs：在线AI模拟真人TTS工具，支持包含中文在内的28种语言的a）功能1：Speech Synthesis 语音合成器，多种语言合成真人语气&逻辑语音。b）功能2：VoiceLab 声音实验室，从头设计自己需要的声音。c）功能3：Voice Library 声音库，有很多用户创建语音的声音社区。d）免费版支持无商业许可下的每月一万字、三个自定义声音、API调用。e）官网在：https://elevenlabs.io/ 3、【最新案例】以更可控的方式写剧本：以刘姥姥一进荣国府的故事为背景，用大模型扩写刘姥姥在荣国府门口摆地摊，以曲线进入荣国府的剧情。4、【行业动态】Meta发布Code Llama，软件开发迎来智能化范式转换拐点a）将大模型的代码能力开源，性能表现非常强悍，且可免费用于研究和商业用途。b）支持三种版本：基础代码模型、Python专用代码模型和针对自然语言指令进行微调的Instruct模型。c）大模型将为软件开发带来三大范式转换：5、【技术视角】如何在一块性能有限的老破小GPU显卡成功运行模型----温馨提示----当前早鸟价“60元/季度”，9月6日恢复原价“90元/季度”；升级到“AI产品经理大本营”社群会员，可抵扣60元，详见专栏介绍链接：https://xiaobot.net/p/ai01

【AI日报_20230826】

1、【重要】【产品视角】如何理解Character.ai 和 Pi 的用户需求a）c.ai、Pi、replika，代表着三个不一样的用户需求：角色扮演、情感陪伴、荷尔蒙宣泄。b）角色扮演：IP即内容。本质是通过「故事」构造架空世界，并使用户产生「代入感」，核心是 fantasy(幻想）。i，玩原神上头叫老婆的、小时候看西游记上头爬上房梁的，都是fantasy. 这是人们对世界的美好寄托，是一个普世需求。ii，要产生fantasy，第一步就是要有好故事——在中国市场上以三种产品形式呈现：长视频、小说和RPG游戏。iii，c.ai 就是IP的下游产业，通过对IP的深度模拟，将在故事中静态的IP动态化，满足用户的fantasy——这是一个明确且巨大的用户需求，且在合适产业链位置中充分发挥了AI的能力。c）为什么说c.ai是角色扮演i，首先，c.ai用户都是冲着游戏、动漫角色去的（70%的互动），无IP角色（如心理医生、写作助手、面试官、游戏玩家等）仅占互动数的5%。ii，从追星逻辑出发，粉丝诉求并不是与明星私人的近距离接触，而是希望明星本人能获得收益/成长（养成妈妈粉），或从粉丝社群中获得社交和充实感（粉丝社群），c.ai在这套逻辑下没切中核心需求。iii，其次，针对这些IP，用户主要需求是「基于角色设定的角色扮演」（占比66%，其中40%为「爱情角色扮演」，另外26%为「冒险角色扮演」）。iv，不少用户提出，想要在一定的故事情节下，攻略角色的感情，这也是c.ai的进一步升级方向 —— 在IP的下游中进行故事再创作。v，综上，c.ai的核心是「好IP」 + 「好模拟」。即，c.ai类的产品，生命线是在上游IP生产厂商的手里的，如今创业公司的优势仅有模型能力。d）引申阅读，之前我的这篇「虚拟陪伴AI，要想真正建立情感链接，这3个备选路径，可能只有最后一个能走通_20230512 https://t.zsxq.com/11G7gnKOg 」 2、【重要】【资源/工具】2款可平替SD的免费AI绘画工具a）无界AI：界面会更加专业，有众多大模型可选（包括ControlNet），分辨率也可自选，但缺点是生成图片需要积分，分辨率越高需要的积分越高（免费送200积分，很快会用光）。不过可以将你的提示词拿去换（卖）积分；此外，只要作品优秀，还可以申请创作者计划，一副作品可以卖200元左右。b）WHEE，美图每天100张免费图片额度，不耗费积分，还可附加Lora，调节相关参数，唯一缺点是分辨率不可选，ControlNet功能有、但稍微偏少。教程在这里。 3、【重要】【最新案例】AGI 大会 DemoShow，路演团队现场视频（下） 4、【行业动态】百度出品的AI编程助手ComateComate（Coding Mate Powered by AI），目前在申请试用阶段a）主要功能有：代码解释、技术问答、实时续写、注释生成代码、生成函数注释与行间注释、生成单元测试、代码优化、代码修复b）编程语言支持：C/C++、Java、Python、Go、JavaScript、TypeScriptc）常用IDE支持：VS Code、IntelliJ IDEA、GoLand、PyCharm、WebStorm、CLion、PhpStorm、Android Studio、Xcode、iCoding等。 5、【技术视角】AI模型测评代码—GhostReview（Stable Diffusion）----温馨提示----当前早鸟价“60元/季度”，9月6日恢复原价“90元/季度”；升级到“AI产品经理大本营”社群会员，可抵扣60元，详见专栏介绍链接：https://xiaobot.net/p/ai01

【AI日报_20230825】

1、【重要】【产品视角】AI 大模型的下一步，或许是 Google 早年的那种便宜方案a）用软件换来的硬件的巨大成本优势，是 Google 早期成功不可忽略的因素。这段历史，会对现在的 AI 格局有所启发？b）当年，Google没有买当时唯一正确的几万美金一台的高端服务器，而是在软木纸上，放上四小片主板、绑上硬盘、插上网卡；然后用软件，做了Google File System 分布的文件系统、在加上自己的 MapReduce 的框架，把计算可以分布（map）在这些小电脑上，然后把结果汇总（Reduce）……因为硬件便宜、算力足、存储便宜，这才足以支撑 PageRank 这样的巨大算力消耗，Google很快就从 Stanford 的一个无名小站，打败了当时的巨头（Lycos，AltaVista，InfoSeek）。c）现在，用 Nvdia a100 的显卡堆出来的ChatGPT，固然帮助我们完成了第一步（从看不到可能性，到证明了可能性），就如同 Lycos 搭起来的昂贵的搜索引擎服务一样。但，是不是有 Google 这样的方式，用软件的方式疯狂的降低硬件成本的可能性呢？ 2、【行业动态】Midjourney更新了very region（局部重绘）功能，相当于结合AI版的Photoshop和SD功能。3、【重要】【技术视角】大模型研发核心：数据工程、自动化评估及与知识图谱的结合a）现有大模型基本情况：分散在3个层级内，i）“买票乘坐”，包含有 GPT-4、 PaLM 等，提供API调用；ii）私有部署，包含有Flan-T5、Pythia等；iii）平民玩法，做一些领域微调得到一个私有部署模型，包含有Alpaka、Koala等。b）现有大模型应用场景：S（阅读理解）；M（语言学的解题或者情感分析、GRE考试）、L（语音或者推理的任务）；XL（高考题或者其他一些更先进的工作）；Next...（偏向于落地，解决更长文本的处理等问题）c）中/英文主流大模型常用预训数据差别较大：i）英文：维基百科、书籍、论文期刊、WebText、Conmmon Crawl、The Pile及代码、论坛等；ii）中文：开源的评测数据、百科的三元组、社区QA、论坛讨论、Common Crawl等。 4、【行业动态】国内首个数学领域千亿级大模型MathGPT开启内测 by 好未来a）通过文字或图片上传数学题，即可得到对话式的解答反馈b）目前支持中文、英文版本的PC端和移动端体验，在部分数据集上有不错的表现。c）申请内测入口详见官网链接。5、【资源/工具】吴恩达 LLM finetune 新教程发布：详见deeplearning官网链接（需科学上网）。----温馨提示----当前早鸟价“60元/季度”，9月6日恢复原价“90元/季度”；升级到“AI产品经理大本营”社群会员，可抵扣60元，详见专栏介绍链接：https://xiaobot.net/p/ai01

黄钊的AI日报·第一季

@hanniman

免费内容

【AI日报_20230829】

【AI日报_20230828】

【AI日报_20230827】

【AI日报_20230826】

【AI日报_20230825】