HomeAI 捕手 (第1季)
AI 捕手 (第1季)

AI 捕手 (第1季)

@Paul Lin

这是一档聚焦于 AIGC 领域的播客精选栏目。

如果你不想错过 AI 潮流,但又没有太多技术背景,或者没有大量时间收听数小时的音频访谈,那么这个专栏就是为你准备的。

专栏为你精选优质深度内容,提炼出精华摘要。以尽量浅显易懂的语言为你带来海内外 AI 领域投资人和创业者的思考判断,让你紧跟趋势。

专栏每一篇的内容包括:核心观点 + 精华摘要 + 扩展知识。

每周三/日更新一期,每一季包含20期,购买后可永久阅读。

【限时福利】其他人通过你分享的链接购买,你可获得30%的返佣
订阅39
文章22
最后更新:2023-10-25 23:33
查看 【AI 捕手 (第1季)】 详情查看 【Paul Lin】 主页
分享到微信打开

免费内容

2023-10-25 23:33

结束语:专栏第一季更新完毕,有些话想对大家说

从8月1号发布专栏第一期,到10月15号专栏最后一期更新完毕,整整两个半月。感触颇深。​​1、用最小成本搭建了一个 AIGC 类产品的MVP,并且验证了有用户愿意为这个产品的价值买单,虽然距离当初50个订阅的目标还有一段距离,按比例看也在及格线上。验证创意未必一定要是开发一个APP,也可以是一个专栏。​​2、用结构化的输出,倒逼体系化的输入,是最好的学习方法。为了运营这个专栏,我几乎翻遍了小宇宙上所有AI类的栏目和单集,加上阅读论文,学习GitHub上的项目,啃各种官方文档,学习效率非常高。专栏的最后一期,特意放了一期AI时代知识管理的访谈,也算是一种呼应。​​3、最大的感受是AI行业真是一日千里,蓬勃发展,典型的证据就是我在专栏发布时拟定的目录,最终大部分都没用上(哭笑不得),不是说当初的选题质量不行,而是实在发展太快,过一段时间就有新的进展出来,专栏也必须保持迭代。​​4、build in public 真是一种最佳的个人开发者策略。不需要遮遮掩掩,大胆地在公开场合说出你的目标,让身边的朋友或网友帮你一起鉴别创意,产品,一起参与优化和传播。​​build in public 的第二个好处就是可以结交很多朋友,通过写专栏我知道了极客公园要举办AI黑客松比赛,通过比赛组委我认识了现在的产品搭档,以及好几个年轻有为的同行,这些都是相比闭门造车更好的一种创造价值的方式。​​虽然第一季承诺的更新目标达成了,但我还有接下来的两个目标:​筹备第二季的专栏,依然是AI领域,但是关注点会从行业趋势变得更加接地气。​继续维护第一季,有好的内容会不定期加上,也算是对第一批种子用户的答谢。最近 Openai 持续放大招,fine turn 的成本进一步降低,大家都在说又要搞死一批 AI 创业公司了,身边有不少 AI 应用层创业悲观论开始出现。​我​个人倒是持乐观态度。一方面从历史发展的角度看,手机操作系统当初底层的能力也是很薄弱,所以移动互联网早期诞生了很多像墨迹天气、手电筒、记事本这样的工具类应用,后面操作系统能力不断迭代,这类应用确实走下坡路,但是操作系统开放出来的能力也越来越多,整个移动互联网的市场并没有因为操作系统的成熟而萎缩,反而是蓬勃发展。​​其次是大家担心做垂直领域调优的 SaaS 公司会不会因为 fine turn 的门槛降低而要凉凉了,我认为也不会。原因在于 To B 的服务是一整套解决方案,并不会因为某个 API 的能力提升而出现门槛的骤降骤升。比如说:那些数据是有用的?要如何格式化?如何进行清洗?大模型输出的质量稳定性怎么解决?兜底的方案怎么设计?这些都依然需要投入大量的人力提供用户教育和运营,至少现阶段我认为依然如此。​​作为一名技术乐观主义者,我认为底层的能力越强,对顶层应用开发者越是利好。大模型会水平扩展能力,但垂直扩展不符合其定位,且规模不经济。最后,祝专栏的各位读者都能抓住这一波 AI 带来的机会,书写自己的精彩故事 :)

2023-10-15 17:15

#20 - AI 无所不知的时代,知识管理还有用吗?

前言当所有人都在说『All in AI』的时候,Flomo 的创始人少楠却冷静地保持着克制的态度。本篇内容中,少楠分享了他为什么不会在今年内为 Flomo 添加 AI 特性的三个原因。虽然大多数人都害怕自己会错过 AI 时代的浪潮,少楠却认为当下谈 all in 的背景已经和当年的移动互联网完全不一样了,要清醒认识创业公司的局限性,不要大手笔投入。如果你也有「FOMO」的困惑,本文分享的真知灼见或可作为参考。让你安心:)核心观点如果使用了 AI 新技术不会提高付费率,我们为何要采用?不要担心错过时代的浪潮,当年移动互联网第一批产品很多都不在了可以多花时间精力在学习 AI 技能上,但大手笔投入则要慎重单纯依靠 AI 是难以真正理解一个概念的本质的要反思自己是利用AI作为工具与杠杆,还是过度依赖AI而成为可被取代的人力。精华摘要1、为什么不会轻易为 Flomo 添加 AI 特性第一,大众用户对AI辅助功能的真实需求还不明确。早期一些 AI 产品用户虽多,但真正需要生成文本等功能的用户有限,过了尝鲜期会迅速失去新鲜感。第二,AI服务成本较高,小公司难以通过用户付费平衡运营成本。第三,AI应用也存在合规风险,如果因违规使用而被断开服务,将对产品运营造成困扰。如果创业者不是很确定的话,那么就去看看哪些产品在加了 AI 特性后排名暴涨,实际的情况是很少。虽然有人会拿 Notion 来举例,但 Notion 的问题是因为它先是 Notion,他已经有很强的用户和口碑积累了,所以可以享受到 AI 带来的红利。而不是说什么产品只要加上 AI 就会火。虽然搞定第一波付费用户问题不大,但明年是否还能续费才是真正的挑战。我们需要问自己,使用了新技术后,付费转化率是否会提高?如果不会,我们为何要采用?2、如何管理这种「担心错失某个时代浪潮」的心理如果我们回看移动互联网时代,你会发现,那个时期第一个创业浪潮中的许多产品,现今已经几乎消失。当时移动互联网红利涌现,各类产品竞相推出,但很快就破灭了,许多产品来去匆匆。从这个角度看,先发产品不一定能长久经营。技术本身不能决定生活,只有当我们学会应用某项技术,才能从中获得价值。此外,嘉宾认为他也不必急于应用新技术,因为他没有通过它融资或者讲故事的需求。一位朋友的一句话让少楠彻底地安心:如果这是一波大浪潮,它不会仅持续一两年,而会存在较长时间;如果它不是浪潮,那么它自然会过去。错过就错过了,也没什么。嘉宾的态度是保持关注新技术,不断尝试使用,但不急于在产品中应用。所有需要投入大量资金和精力的决策可以稍后考虑,但学习和体验新事物则可以立即开始。3、当下 All in 可能是无用的很多人提出了要在当下『All in AI』的观点,其实『All in』最初是投资人和硅谷提出的。他们主张要“快速行动,打破常规”,这些建议在当时的背景下也并无错。因为在那个时代,互联网刚刚起步,竞争是平等的,所以企业确需快速行动以占领市场。正如维特根斯坦晚年所说,任何观点都必须结合具体语境来判断。但是,我们需要重新审视这一观点在今天的背景下是否仍然适用。当下的竞争环境是全方位的,大公司与创业小公司的优势差别巨大。即使是机器学习等前沿技术领域,成功的创业公司也寥寥无几。我们无需着急去追逐这一领域,因为不大可能在其中取得成功。相反,我们需要冷静思考后再行动。4、AI 『无所不能』的时代,哪些知识才是真正应该聚焦投入的AI 可以帮助快速获取某一概念的背景信息,了解其发展脉络,但想深入理解一个观点的核心含义,仍需本人反思工作、生活经验,在此基础上与该观点所蕴含的意义、价值产生联系,通过这一过程逐步达成对其的理解。单纯依靠AI是难以真正把握一个观念的实质的。关于应该学习什么知识这个问题,AI无法给出答案,因为作为人类,只有我们自己明确学习目的,才能做出选择。真正掌握一项知识也需要人类自己的理解和运用。AI可以提供信息,但如何消化吸收知识,并将其应用到解决实际问题上,仍需要人的智慧。我们之所以学习,是为了实现某种目标,应如何理解知识,以及后续如何运用知识,这些都是AI不可替代的,这些 AI 无法取代的知识能力,才是我们应聚焦投入的方面。5、如何做个人的知识管理做笔记前就要先考虑未来的用途。单纯做笔记收集信息价值不大。在获取知识后更要用自己的语言进行表达,建立关联,形成自己的框架,而不是线性排列。最终才能实现知识的内化。在AI时代,我们也需要反思自己是利用AI作为工具与杠杆,还是过度依赖AI而成为可被取代的人力。历史上,所有将自身作為杠杆者最终都被新技术取代。我们应努力增强自身能力,使之成为不可轻易替代的独特价值。播客链接前往收听扩展阅读Flomo 笔记方法

2023-9-7 13:21

【加更】AI 领域的机会 (2023年吴恩达斯坦福最新演讲)

【译者注】文章翻译自吴恩达博士与2023-8-30日在斯坦福的演讲《Opportunities in AI》虽然是讲趋势,但演讲的前1/3是在扫盲PPT 和翻译文案是对齐在保持全文意思不变的情况下,对于部分段落我增加了「译者注」,描述了一些背景知识和我个人对这个演讲的主观理解非常感谢你,Lisa。见到各位我很高兴。今天我想和大家探讨一下AI领域的机会。我一直说 AI 是新的电力。理解 AI 的其中一个困难之处在于:它是一个通用技术。意味着它不仅仅对一个领域有用,而是对许多不同的领域都有用,有点像电力。如果我问你电力对什么有用?不仅仅是一样东西,而是许多东西。所以我想先和大家分享一下我对技术的看法。这将引出一系列的机会。AI领域有很多令人兴奋的事情,我认为理解 AI 的一个很好的方式就是:把它看作为一系列工具。这包括一种称为监督学习的技术,它非常擅长识别或标注东西。以及生成式AI,这是一项相对较新且令人振奋的发展。如果你熟悉AI,你可能听说过其他工具。但我今天不会过多谈论其他的工具,而会集中讨论我认为目前最重要的两项工具,即监督学习和生成式AI。监督学习非常擅长给东西贴标签,或非常擅长计算输入和输出,或者从A映射到B。给定一个输入A,给我一个输出B。例如,给定一封电子邮件,我们可以利用监督学习将其标注为垃圾邮件或非垃圾邮件。我参与过的在这方面最赚钱的应用可能是网络广告,给定一个广告,我们可以标注用户是否可能点击它,从而展示更相关的广告。对于自动驾驶汽车,给定汽车的传感器读数,我们可以标注出其他汽车的位置。我的团队AI Fund参与过的一个项目是船舶航线优化,给定一艘船正在航行或考虑航行的路线,我们可以标注它预计会消耗多少燃料,并用此来提高船舶的燃料效率。我们在工厂中做了大量自动视觉检查工作,你可以拍一张刚制造的智能手机的图片,并标注它是否有划痕或其他缺陷。或者,如果你想建立一个餐厅点评监控系统,你可以用一个软件来查看网上餐厅点评,并标注其为正面或负面评价。监督学习有一个很好的地方,一个很酷的地方是,它不仅仅对一件事有用,它对所有这些不同的应用都很有用,还有很多其他应用。让我具体地演示一遍一个监督学习项目的工作流程,例如给餐厅点评贴标签。你首先收集一些数据点或数据集,比如说熏三明治非常好吃,这是正面评价。服务员服务慢,这是负面评价。我最爱的鸡肉咖喱,这是正面评价。这里我举了三个数据点,但在实际操作时,你可能会收集成千上万这样带标签的数据点或训练样本。一个机器学习或 AI 项目的工作流程是,你首先获得标注过的数据,可能是成千上万的数据点。然后,你让一个 AI 团队用这些数据训练一个 AI 模型。最后,你可能找一个云服务来运行这个训练好的AI模型,然后你可以给它输入新数据,它会给出正面或负面判断。我认为过去十年可能是大规模监督学习的十年。我们大约在 10~15 年前就发现,如果训练一个小的 AI 模型,一个小的神经网络或小的深度学习算法,可能不需要非常强大的计算机。当你输入越来越多的数据时,它的表现会稍微提高一点,但随后提升的曲线会变得平缓,效果会达到瓶颈期,它将无法继续利用数据来不断改进。但是如果你训练一个非常大的 AI 模型,大量的计算能力可能是在强大的 GPU 上,那么当我们扩大提供给机器学习模型的数据量时,它的性能会不断地变得更好。所以当我开始领导谷歌大脑团队时,我指导团队要解决的主要任务就是构建一个真正大的神经网络,并向它输入大量的数据。幸运的是,这个方法奏效了。我认为大规模计算和大规模数据的思路真的帮助我们在过去十年里推动了很多 AI 的进步。所以如果上个十年是 AI 的十年,我认为这个十年除了监督学习之外,还将兴起激动人心的生成式 AI。可能你们许多人,甚至在场的所有人都体验过 ChatGPT 和 DALL-E等。给定一段文本作为提示,比如“我喜欢吃”,如果你多次运行,可能会生成“奶酪冰淇淋”或“妈妈做的中餐”等输出。AI系统可以生成这样的输出。鉴于人们对生成式 AI 的热烈关注和兴奋,我想花半张幻灯片简要谈谈它是如何工作的:生成式 AI,至少在文本生成方面,其核心是使用输入输出映射的监督学习来重复预测下一个词。如果系统在网上读过这样一个句子:“我最喜欢的食物是奶酪奶油百吉饼”,它会把这个句子转换成几个数据点,如果它再次看到“我最喜欢的食物是”,它会尝试猜测下一个正确的词是“百吉饼”,或者如果它看到“我最喜欢的食物是百吉饼”,它会尝试猜测下一个词是“和”。同样,如果它看到“奶酪”,它会猜测下一个正确的词应该是“奶油”。通过提取互联网或其他来源上的文本,并使用这种输入输出的监督学习来重复预测下一个词,如果你在数以十亿计的词上训练一个非常大的AI系统 (例如在最大的模型中,现在已经超过1万亿个词),那么你就得到了像 ChatGPT 这样的大语言模型。还有其他一些重要的技术细节。我谈到了预测下一个词,技术上讲,这些系统预测下一个子词或词元的一部分。然后还有其他技术,比如RLHF (译者注:Reinforcement learning from human feedback,全称是基于人类反馈的强化学习) 用于进一步调整AI输出以使其更有希望、诚实和无害。但是其核心是使用监督学习来重复预测词语,这才真正实现了大语言模型的激动人心而惊人的进步。虽然许多人将大语言模型视为一个绝佳的消费者工具,你可以去 ChatGPT 等网站使用大语言模型。我也认为这非常棒。但我认为一个还不被充分认识的趋势是,大语言模型不仅是消费者工具,也是一个开发者工具。事实证明,以前要花我几个月才能构建的应用,现在许多人可以用大语言模型更快地构建。具体来说,构建餐厅点评系统等的监督学习工作流程是,你需要获取一些标注好的数据,这可能需要一个月才能获得几千个数据点。然后,一个 AI 团队需要训练、调整、优化 AI 模型的性能,这可能需要3个月。然后找到一个云服务来运行它,确保它稳定可靠地运行。这可能再需要3个月。所以,构建一个商业级的机器学习系统的一个较实际的时间表大约是6到12个月。我领导的团队,我们通常花费大约6到12个月来构建和部署这些系统。其中一些最后变得非常有价值。与基于提示的AI相比,现在你只需要编写一个提示,这可能只需要几分钟或几小时。然后你可以在几个小时或几天内将其部署到云端。现在,以前花费我6个月甚至1年才能构建的某些AI应用,全球许多团队现在可以在1周内构建。我认为这已经开始发生,但最好的还在后头。这开始敞开大门,可以建立更多可以被更多人构建的AI应用。所以我认为许多人仍低估了即将出现的海量定制AI应用的规模。接下来,我知道你可能没想到我会在演示中编码,但我就是要这么做。(译者注:在演讲中吴恩达博士基于 Jupiter notebook 现场演示了通过 chatGPT 的prompt,让AI对文本内容的正负面情绪进行判断的例子,感兴趣的可以在 DeepLearning.ai 上找到相关的课程)。事实证明,这就是我构建情感分类器所需的全部代码!所以我会用Python导入一些OpenAI的工具,然后我有这样一个提示:"将以下用3个破折号限定的文本分类为积极或消极情感"。现在我就直接运行它。这是我第一次运行,所以我真的希望它能工作。哦,太好了。它得到了正确的答案。这段文字(译者注:就是 Prompt)就是构建情感分类器所需的全部代码。今天,全球的开发者可以用10分钟左右构建这样一个系统,这是一个非常令人兴奋的进展。因此,我一直在努力教授如何使用提示,不仅作为消费者工具,也作为开发者工具。接下来,我会分享一下我看到的一些 AI 机遇。以及我认为的不同 AI 技术在今天的价值。我会谈谈3年后的情况。但今天 AI 的绝大部分商业价值来自我认为的监督学习,对一个像谷歌这样的公司,每年的价值可能超过1000亿美元。而且还有数百万开发者正在构建监督学习应用程序。所以它已经非常有价值,并且有强大的势头推动它。而生成式 AI 则是一个真正激动人心的新入局者,目前它还很小。为了完整性我还列出了其他工具。这些圆圈表示今天的价值。我认为3年内它可能增长到这里。所以监督学习已经非常巨大,在未来3年可能会翻一番,从非常巨大成为更加巨大。而生成式 AI 今天还很小,我认为在未来3年内会增长好几倍,因为开发者的关注量、风险投资的投入量以及大公司探索应用的数量。我也指出3年是一个非常短的时间范围。如果以任何接近这个速率的复利增长,那么6年后会更加巨大。但这个浅绿色或橙色的浅色区域,那个浅色区域是新的创业公司或大公司可以创造和获取价值的机会所在。我希望你从这张幻灯片中获得的一个信息是,所有这些技术都是通用技术。在监督学习的情况下,过去十年必须做的大量工作仍在继续,未来十年是识别和执行具体用例。这个过程对于生成式 AI 也正在启动。所以在演讲的这一部分,我希望你能够了解通用技术可用于许多不同的任务。使用监督学习仍可以创造很多价值。尽管我们还远未完成发现监督学习的激动人心的用例,而惊叹的生成式 AI,它进一步扩展了我们现在可以用 AI 做的事情。但是需要注意的是,在过程中会有短期的起伏。我不知道你们是否还记得一个叫Lens的应用程序。这个应用程序可以让你上传自己的照片,它会把你渲染成一个很酷的宇航员、科学家或其他角色。这是一个挺酷的想法,人们也喜欢它。去年12月它开始疯狂飙升。然后它就完蛋了。因为Lens其实是一个在别人强大 API 之上的相对单薄的软件层。所以尽管它是一个有用的产品,但不是一个可防御的业务 (译者注:这是我在专栏上一期中重点 highlight 的一个点,目前国内大模型创业投资为什么雷声大雨点小,其中一个原因就是投资人普遍怀疑应用层的护城河)。当我思考Lens这样的应用时,它实际让我想起史蒂夫·乔布斯给我们iPhone后不久,有人写了一个我付1.99美元的应用程序,可以打开LED灯,把手机变成手电筒。这确实是一个好主意,写一个应用来打开LED灯。但它也不是一个可持续的长期商业模式,因为它很容易被复制和低价竞争,最终被集成到 iOS 中。但随着iOS和iPhone的崛起,还有人想出了如何建立 Uber、Airbnb 和 Tinder 等非常可持续、可防御的业务,创造持续价值。我认为随着AI或新AI工具的兴起,真正让我兴奋的是创造那些非常深入、非常难的应用程序的机会,希望它们能创造长期价值。所以我想分享的第一个趋势是,AI是一个通用技术,我们前面还有大量工作,那就是发现非常多样化的用例并构建它们。我想和大家分享的第二个趋势,是关于为什么 AI 目前还没有被更广泛地应用。感觉上我们好像聊了有15年关于AI的话题,但你要是看看现在AI的价值主要在哪里,很多还是集中在消费软件和互联网行业,对吧?离开这个范围之后,在其他领域的AI应用相对来说还是少得多,而且都还处于初级阶段。这是为啥呢?其实,如果你把所有现有和潜在的 AI 项目按照价值从高到低排列,在这个曲线的前端,都是一些价值数十亿美元的项目,比如广告、网络搜索,或者像亚马逊这样的电商推荐系统。十几年前,我和几个朋友就找到了一个方法:就是招几百个工程师,写一个软件来提供更精准的广告,然后把这个软件应用到数亿的用户上,从而产生巨大的财务价值。这一招在消费软件和互联网行业挺管用的。但是,一旦你走出这个行业,很少有公司有那么多资源来推广一个软件产品。所以,当你转向其他行业,比如我看到并且很兴奋的一些项目,情况就完全不同了。我曾与一个制作披萨的公司合作,他们通过拍照片来确保芝士会均匀地被铺在披萨上,这个项目大概值500万美元(译者注:这里的意思应该是通过图片识别的方法)。但是,你不可能为了一个500万美元的项目去招几十个或者一百个工程师,这根本不合算。还有一个例子是,我与一个农业公司合作,我们用摄像头来测量小麦的高度。由于风或雨的原因,小麦常常会弯曲。我们可以在合适的高度割下小麦,这样既能为农民带来更多的收入,也更环保。但这也仅仅是一个500万美元的项目,用大量的工程师去做,也是不划算的。类似的,还有材料分级、布料分级、金属板分级等多个项目。这都是我见到并且觉得有潜力的项目,但都需要一种新的开发和应用模式。所以,在这个曲线的左侧头部,我们有少数几个价值数十亿美元的项目,而我们已经知道如何在其他行业中执行这些项目来创造价值。我看到的是一个非常长的尾巴,有成千上万个我们可以称之为500万美元项目,而到目前为止,由于定制成本高,这些项目非常难以执行。我认为令人兴奋的趋势是,AI 界已经在构建更好的工具,让我们能够汇总这些用例,并使终端用户能够轻松进行定制。具体来说,我看到很多令人兴奋的低代码和无代码工具,使用户能够定制AI系统。这意味着,我们不再需要过多地担心如何处理披萨的照片,因为我们开始看到可以让披萨制造工厂的IT部门自己用他们自己的披萨照片来训练AI系统,从而实现这500万美元的价值。顺便说一句,这些披萨的照片是不存在于互联网上的,所以谷歌和必应无法访问这些图片。我们需要的是可以由披萨工厂自己使用,来构建、部署和维护基于他们自己的披萨照片的定制AI系统的工具 (译者注:这就是目前行业都在探索的,基于企业私有的数据来构建 AI 应用。业界有一个观点:存在于互联网上的公开数据价值天花板是很低,一方面是谁都可以爬取到,另外一方面是这些数据的质量和真实度是打折扣的)。在更广泛的层面上,实现这一点的技术有一部分是基于文本提示或视觉提示,但主要是大型语言模型和类似的工具,或者一种叫做“AI数据中心”的技术。这里的核心思想是,我们不再要求披萨工厂写大量的代码(这很具挑战性),而是让他们提供数据,这实际上更容易做到。我认为这第二个趋势很重要,因为我觉得这是把 AI 的价值从目前主要集中在科技界和消费软件互联网界,推广到所有行业,真正推向整个经济体的关键配方之一。有时候我们容易忘记,整个经济体其实比科技界要大得多。前面我分享了两个趋势。第一,AI是一种通用技术,有很多具体的应用场景等待被实现;第二,本地化的、易用的工具使 AI 能够在更多行业中得到应用。那么,我们应该如何抓住这些机会呢?大约五年前,我有一个想解决的问题:我觉得现在有很多有价值的AI项目是可行的。我在想,我们该如何完成它们?之前在谷歌和百度这样的大科技公司带领AI团队的经历让我很难弄明白如何在一家大型科技公司中运营一个团队,以追求从海运到教育、从金融服务到医疗保健等非常多样化的机会。这些用例、市场和客户群都非常多样化。我觉得最有效的方式是,我们可以创建很多不同的公司来追求这些多样化的机会。因此,我最终创办了AI Fund,这是一个创业工作室,专门为追求多样化的AI机会而创建初创公司。当然,除了大量的初创公司外,现有的大公司也有很多机会将 AI 整合到现有业务中。事实上,我发现对于现有企业来说,分销通常是其中一个重要优势,这使得它们能够非常高效地将 AI 整合到自己的产品中。但反观整个局面,机会究竟在哪里呢?我个人把它想象为一个AI技术栈。在最底层是硬件半导体层,那里有绝佳的机会,但也需要很大的资本投入,竞争也很激烈。需要的资源很多,但真正能成功的人相对较少。有些人可以并且应该在那里发挥作用,但我个人不太愿意在那里参与。还有基础设施层,那里同样有极好的机会,但也需要大量的资本,竞争也很集中。所以,我也不太愿意在那里深入。然后还有开发者工具这一层。我刚才展示的其实是使用 OpenAI 的 API 作为一种开发者工具。我认为,开发者工具这个领域竞争非常激烈。看看有多少初创公司在追赶OpenAI。但是会有一些超级赢家出现,因此我偶尔也会在这里参与,主要是当我认为有意义的技术优势存在时,因为我觉得这会增加你成为超级赢家的机会。最后,尽管很多媒体关注和热度都集中在基础设施和开发者工具层面,但实际上,只有当应用层更加成功时,其他前面介绍的这些下层公司,才能真正取得成功。这点我们在软件即服务(SaaS)的崛起中也有所体验。大量的热情都集中在技术和工具层,这没什么问题。但让它们成功的唯一途径就是应用层能够更加成功,坦率地说,能够创造足够的收入来支付基础设施和工具层的费用。(译者注:这个观点和国内现在主流的观点是不同的)让我举一个例子。Omora是我们建立的一个公司,用 AI 进行恋爱关系辅导。我要指出,我是个 AI 从业者,但对浪漫可说是一窍不通,如果你不相信,你可以问我的妻子,她会证实我对浪漫一无所知。但当我们想要建立这个项目时,我们与前Tinder首席执行官Renata Nybob合作。凭借我团队在AI方面的专长和她在恋爱关系方面的专长(毕竟她经营过Tinder,对恋爱关系了解得比我认识的任何人都要多),我们能够使用AI建立起相当独特的恋爱关系辅导服务。这类应用的有趣之处在于,当我们环顾四周时,世界上同时精通AI和恋爱关系的团队实际上并不多。在应用层,我看到了许多令人兴奋的机会,这些机会似乎有着非常大的市场,但与机会的巨大性相比,竞争相对较轻。这并不是说没有竞争,而是与开发者工具或基础设施层相比,竞争强度要小得多。因为我花了很多时间不断迭代如何建立初创企业的过程,所以我会非常诚恳地告诉你们我们为建立初创企业所开发的“配方”。经过多年的迭代和改进,这就是我们现在如何建立初创企业的方式。我的团队总是有很多不同的想法,这些想法可能是内部生成的,也可能来自合作伙伴,我想用一个例子来详细说明这一点,那就是一家使用 AI 提高船舶燃油效率的公司——Bearing AI。这个想法是几年前一个大型的日本企业集团MITI(他们是主要航运线的重要股东)找到我,他们对我说:“嗨,Andrew,你应该建立一个利用AI提高船舶燃油效率的业务。”具体的想法是,把它想象成船舶的Google Maps。我们可以建议或告诉一艘船如何航行,以便你依然能准时到达目的地,但消耗的燃料大约会少10%。现在我们做的是,会花大约一个月的时间去验证这个想法。需要反复确认这个想法在技术上是否可行,大约会花一个月,与潜在客户进行沟通,以确保这是一个市场所需的产品。如果通过了这个阶段,那么我们就会去招募一位CEO,与我们一起在该项目上工作。早期,我通常会在找到 CEO 之前,自己花很长时间在项目上工作。但经过反复迭代,我们意识到,从一开始就带上领导者与我们一起工作,会减少很多知识传递的负担,或者减少新CEO加入后需要重新验证我们所发现的东西的可能性。因此,我们学到的更高效的流程就是从一开始就带上领导者。(译者注:吴恩达博士的观点应该是不要让 AI 人员陷入到具体的一个个业务学习和场景决策中,这并非他们的专长,最好的方法是当验证了早期的市场需求和 AI 技术可行性后,通过招募该行业的专家作为 CEO,来尽早进入商业化运作的阶段)因此,在Bearing AI 的例子中,我们找到了一位出色的CEO,Dylan Kyle,他是一位重复创业者,之前有过一次成功的退出。然后我们花了三个月的时间,进行了六次两周的冲刺,与他们一起构建了一个原型,并进行了深入的客户验证。如果它通过了这个阶段(我们大约有66%的生存率),我们便会写下第一张支票,这将给予公司足够的资源去雇佣高级管理团队,构建关键团队,让MVP(最小可行产品)运行起来,并获得一些真正的客户。然后在那之后,希望能成功地筹集到额外的外部融资轮,可以继续成长和扩张。(译者注:这是一个典型孵化器模式)因此,我对我的团队能做的工作以支持三井(Mitsui)的想法和Dylan Cow担任CEO感到非常自豪。现在全球高海上有数百艘船舶因为Bearing AI而改变了它们的航行方式。10%的燃料节省大约相当于每艘船每年可能节省450,000美元的燃料费用,而且这对环境保护也很友好。我认为如果没有Dylan的出色工作,以及三井把这个想法带给我,这家初创公司可能根本就不会存在。我喜欢这个例子,因为这是一个我自己永远也想不出来的初创公司想法。我虽然坐过船,但我对海运了解有多少呢?但正是三井的深厚专业知识,再加上Dylan和我的团队在AI方面的专长,使得这一切成为可能。因此,当我在AI领域运营时,我所学到的一点是,我的专长领域仅限于AI。因为我没有时间去成为海运、恋爱关系、医疗保健和金融服务等各个方面的专家。但如果我能准确地进行技术验证,然后使用AI资源确保AI技术能快速而良好地构建,我认为我们总能帮助公司建立一个强大的技术团队。然后,与主题专家合作通常会带来令人兴奋的新能力。我想与大家分享另一个关于建立初创公司的奇怪教训,那就是我喜欢只在有具体想法的时候才参与。这与你通常从设计思维方法中听到的建议相反,后者的观点通常会说“不要急于找解决方案”,要先探索许多替代方案。诚实地说,我们尝试过那样做,效率非常低。我们学到的经验是:在构思阶段,如果有人对我说,嘿,安德鲁,你应该将其应用到金融服务领域,因为我不是金融服务领域的主题专家,去了解足够多的金融服务信息以找出应该做什么,对我来说是一个非常劳力密集、缓慢且昂贵的过程。相反,我的一个合作伙伴以技术的名义提出了这样一个想法,虽然不是很认真,假设说由GPT提出一个具体想法:通过自动购买每个产品广告商的产品,以换取不再看到任何广告。这不是一个好主意,但它是一个具体的想法。事实证明,具体的想法可以高效地被验证或证伪,它们还给团队一个明确的执行方向。在当今这个充满兴奋和关注的AI世界里,有很多领域专家已经对该领域的问题深思熟虑了几个月,有时甚至一两年,但他们还没有找到合作伙伴。当我们与他们聚在一起,听到他们与我们分享的想法,这让我们能够与他们非常快速地进行验证和建设。我发现这样做是有效的,因为有很多人,他们已经做了设计思维方面的工作,探索了很多想法,并筛选出了真正好的想法。我发现有很多好的想法横亘在那里,没有人在做,找到那些已经有人有想法了,并且愿意与我们分享、并且愿意为此建立合作伙伴的好想法,这被证明是一种更高效的工作方式引擎。(译者注:我理解吴恩达博士的观点是与其天马行空地由技术人员去想一些飘渺的想法,不如和去行业领域专家交流,看看他们有什么明确、具体的痛点,甚至是解决想法,然后再用 AI 的能力去让解决方案变得可行甚至更高效)在我结束之前,我想简单地谈谈 AI 带来的风险和社会影响,AI 是一项非常强大的技术。可能你已经猜到了,我的团队和我致力于推动人类进步的项目。我们多次因伦理原因而终止了在财务上看似稳健的项目。有时我会感到惊讶甚至沮喪,因为人们能够想出看似有利可图,但实际上不应该被实现的非常糟糕的想法。我们基于这些原因终止了一些项目。必须承认,今天的人工智能确实还存在偏见、公平性和准确性问题,但这项技术也在迅速改进。我认为现今的 AI 系统比六个月前更少偏见、更加公平,这并不是说我们可以忽视这些问题的重要性。它们当然是问题,我们应该继续解决它们。与此同时,我也很高兴看到许多 AI 专家正在努力解决这些问题。当我思考AI的最大风险时,我认为其中最大的风险之一是对就业的破坏。这是一张由宾夕法尼亚大学和 OpenAI 的一些人员在一篇论文中分析不同工作受到 AI 自动化影响的程度的图表。结果显示,与之前的自动化浪潮相比,之前主要是低薪工作最容易受到影响,比如当我们在工厂里安装机器人代替工人的时候。而当前的自动化浪潮实际上更多地影响了高薪工作,因为更多的任务暴露于AI自动化的风险之下。(译者注:比如说简单的文案撰写、简单的数据分析等等)即使我们通过使用 AI 创造了巨大的价值,我作为公民,以及我们的公司、政府和社会,都有强烈的责任确保那些特别是生计受到影响的人仍然得到很好的照顾和对待。最后,每次AI取得重大进展时,总会有关于通用人工智能(AGI)的大量炒作。例如,深度学习10年前开始表现出色时,AGI的炒作也随之而来。现在GPT性能非常好,又有一波关于AGI的炒作。但我认为,能做任何人类能做的事情的人工智能还需数十年,可能需要30到50年,甚至更长时间。我希望我们能在有生之年看到,但我认为这不会很快发生。一个挑战是,生物智能和数字智能走的是非常不同的路径。以人类为基准来定义AGI其实是一个有趣的对比。也许在我们的有生之年。还有很多关于AI对人类构成灭绝风险的过度炒作。坦白说,我看不出 AI 如何构成对人类的实质性灭绝风险。人们担心我们不能控制AI,但我们有丰富的经验来控制比任何个人都要强大的实体,如公司或国家,并确保它们在大多数情况下都能造福人类。技术是逐渐发展的,所谓的"突然爆发"场景 —— 即一夜之间突然取得超智能并接管世界——是不现实的。AI技术会像所有技术一样逐渐发展,这给了我们充足的时间来进行监督和确保其安全性。最后,如果你看一下对人类真正构成灭绝风险的事物,如下一次大流行病或由于气候变化导致某些地区人口大幅减少,甚至是概率较小但也许有一天会发生的小行星撞击,我认为解决这些真正的灭绝风险的关键部分将是 AI 的智能。所以,我觉得如果你希望人类在未来的一千年里生存和繁荣,与其减缓AI的发展,不如让AI尽可能快地发展。人工智能作为一种多用途的技术,为所有人开辟了大量新的可能性。对我们所有人来说,未来令人激动和重要的工作在很大程度上将是去开发那些具体的用例。我也期望在未来有更多的机会与你们中的更多人就这些机会进行深入的互动。因此,我想对你们所有人表示最诚挚的感谢。(完)吴恩达博士斯坦福大学演讲视频

2023-8-31 19:0

【置顶】购买前你需要知道的事情

一、《AI 捕手》是一个什么专栏你可以把它看成是一本电子期刊,定期汇总优质内容,总结成精华摘要提供给读者。读者可以按期买断阅读。二、《AI 捕手》适合什么人阅读互联网从业者,例如产品经理、程序员感兴趣甚至希望投身 AIGC 领域创业的人群如果你没有什么技术背景,但又不想错过 AI 发展潮流,其实也不难,我推荐的方式就是:好好利用 GPT、Claude 这样的工具,当成一位循循善诱的老师,请他教你。三、《AI 捕手》能提供给读者什么价值首先,专栏是一个人肉的「精品过滤器」专栏的每一篇播客我都从头到尾完整听完,从各个不同的维度综合打分后,合格的才会被推荐出来。其次,专栏是一个人肉的「精华萃取器」对于忙碌的打工人,或者非科班出身的读者,要听完一两个小时的访谈,发现、记住、理解有用的信息,实在太难了!所以我把播客的精华内容提前总结成一篇小作文的规模(500字左右),让读者可以在等车、吃饭、睡前快速 get 到整集播客的精华。四、《AI 捕手》专栏内容预告为了方便各位读者更好地享用本专栏,我对内容进行了分类。各位读者用户可以根据需要自行前往阅读- 百姓 AI CEO 王建:硕大白话聊 ChatGPT- 腾讯游戏数据科学副总监孙煜征:谈ChatGPT 的几个基本问题- AI 无所不知的时代,知识管理还有用吗?- AI 第二波浪潮拉开帷幕- 前阿里巴巴集团副总裁贾扬清:大模型的开源之战与应用时代- 真格基金合伙人刘元:从即刻黑客马拉松看国内 AI 市场机会- 软银愿景基金前管理合伙人陈恂:大模型全球降温后,人工智能何去何从- 嘉宾对谈:OpenAI 走下神坛了吗?- 真格基金管理合伙人戴雨森:谈国产大模型与 GPT4的差距所在- 出门问问创始人李志飞:要做中国OpenAI?劝各位同仁冷静点- 微软小冰CEO李笛:只做大模型不追求商业模式是很难生存的- AI Agent 引擎 + 出海,做 AGI 时代的那艘大船- 会读创始人访谈:AI 时代的阅读工具创业思考- SAV 创始合伙人王英骁:我为什么投资 Jasper- 百川智能王小川:大模型创业100天的思考- 真格基金EIR 季逸超:一个AI创业者的反思、观察和预测- Dify 创始人路宇:谈谈 LLMops 创业心得- 零基础如何快速入门 AI 大模型- Chato 王建硕专访:现阶段的 AI 创业,就是要拿着锤子找钉子- 真格基金戴雨森:有关创业、投资与 AI 的详细指南

2023-8-5 9:35

#3 强烈推荐:大白话聊 ChatGPT

前言当人工智能可以如此流畅地使用语言和我们对话时,一个科幻预言正在成为现实。OpenAI推出的 ChatGPT,利用大规模语言模型和深度学习技术,实现了前所未有的人机语言交互效果。这是否标志着人工智能已经具备了“意识”?它将如何改变我们的世界?知名技术专家王建硕与主持人针对ChatGPT的科技内涵及社会影响进行了深入探讨。他们从语言模型的训练方法、工作机制,到 ChatGPT背后的商业逻辑,再到人工智能教育等多个维度,为我们全面解析这场人机交互的革命带来的启示。王建硕认为:ChatGPT开启了“语言用户界面”的新时代,其影响或许堪比1994年网页浏览器的发明。但它也有明显的局限,距离真正的通用人工智能还很遥远。更重要的是,我们应积极拥抱人工智能,而非被动地适应它。让我们一起来读读取这场对话中的见解,会给我们带来怎样的思考?也许你我都将成为见证历史的一分子。一、核心观点1. ChatGPT是一个产品化的大语言模型,使软件可以直接处理人类语言,开启了新时代的人机交互方式。2. 大语言模型参数更多、训练语料更全面,可以处理更多不同的语言任务,是自然语言处理的趋势。3. ChatGPT的生成就像先压缩再解码,会有信息损失和不确定性,这是其局限的技术原因。4. ChatGPT显示出一定的“涌现”能力,但距离真正的通用人工智能还有差距。5. ChatGPT对互联网的影响或将如1994年浏览器的出现,开启一个新领域。6. 中国有必要发展自己的大语言模型,不能错过这场技术变革的机遇。7. ChatGPT是语言模型,需与搜索引擎等互补,才能发挥最大价值。8. ChatGPT没有真正的意识或自我,但会给用户一种“有意识”的感觉。9. ChatGPT显示工程落地也同样重要,将技术做成产品推向大众。10. 普及AI的正确使用教育非常必要,避免技术被少数人垄断、加剧不平等。二、精华摘要ChatGPT 首先是一个产品,其次才是一个大语言模型ChatGPT首先是一个产品,然后才是一个语言模型。它是OpenAI推出的GPT系列模型中的一员,通过在GPT-3基础上进行针对对话的优化训练而成。可以看作是一个将人类语言作为输入,并产生相关语言输出的专家系统。自然语言处理NLP的两大分支:大语言模型VS特定语言模型自然语言处理NLP有两种主要方法:大语言模型与特定语言模型。特定语言模型针对具体任务效果较好但适用范围窄;大语言模型参数更多、语料更全面,可以处理更多不同任务,适用范围更广。ChatGPT属于大语言模型。GPT-3.5中的3.5编号是怎么来的?GPT-3.5的3.5表示它是在GPT-3基础上进行聊天微调优化的新版本,而不是全新训练的模型。OpenAI正在开发参数量将是GPT-3 600倍的GPT-4,而ChatGPT是GPT-3之后的一个迭代,所以编号为3.5。ChatGPT中的G、P、T三个字母及微调的含义G代表生成式模型,P代表预训练,T代表Transformer。微调是在预训练基础上使用特定数据进行的进一步训练,这种预训练+微调模式大幅降低了训练成本。特德·姜的文章比喻:ChatGPT是人类知识模糊的JPG图片该比喻生动地解释了ChatGPT的生成过程:先压缩文本到小向量,再解码扩充,此过程中信息损失,需要增添新信息,结果不可避免有“模糊”的错误。就像先压缩再解压JPG图片,与原图有差异。这种比喻很好地解释了ChatGPT生成时的问题原因。人工智能幻觉是怎么产生的,需要规避吗?ChatGPT会产生两种“幻觉”:一种是没有根据就胡说八道;另一种是在解码时需要增添新信息产生的“模糊”。前者可以要求其回答时引用依据,后者是其工作原理所致,无需规避。重要的是知道如何正确使用这个工具。为什么ChatGPT是数学很差的文科生? 它在做的是文字补全/文字接龙ChatGPT是大语言模型,只进行文字的预测和补全,并没有真正理解数学概念和公式推导,所以在数学上表现很差,只能对简单计算进行形式操作。这与其只训练语言能力,而非真正逻辑思维能力有关。近两年大语言模型的突破性进展:涌现、思考链路,但依然算不上通用人工智能近年大模型在某些方面出现了惊人的“涌现”能力和形成某种“思考链路”的迹象,但仍只是语言模型,没有超出训练范围,难以达到真正通用人工智能的灵活智能。ChatGPT开启了自然语言人机交互新纪元,但依然有差距。建硕经历的四次历史上的惊叹时刻,其中浏览器时刻与ChatGPT时刻极为相似建硕分享了他的四个历史性的技术惊叹时刻:1)1994年浏览器出现 2)Google出现 3)iPhone出现 4)ChatGPT出现。其中浏览器和ChatGPT给他带来的震撼体验最为相似。Web3目前还相当于互联网的1979年,虽改变人类世界的能力,但还未到火候,在行业里等待可能是危险的Web3仍处于早期,像1979年的互联网,改变世界潜力巨大但尚未成熟。若在行业内等待其成熟而不积极尝试,可能错失机遇。应像对浏览器时那样,及早尝试使用ChatGPT等新技术。中国有必要再做一个类似ChatGPT的大语言模型吗?建硕认为中国有必要再做一个类似ChatGPT的大语言模型,这是大概率事件,尽管短期内不太可能达到ChatGPT的效果,但可以推动自然语言处理技术进步。中国参与这个竞争十分必要,不能错过机遇。ChatGPT与搜索引擎的关系ChatGPT是语言模型,很难取代包含大量知识的搜索引擎。两者可互补:搜索引擎提供信息,ChatGPT理解问题并产生语言响应。ChatGPT本身更适合作为一个工具使用。ChatGPT有没有自我/意识/人格?ChatGPT没有真正的自我意识或人格,它只是预测文本的语言模型。但在深入交互时,会给用户一种“有意识”的感觉。这源自用户的主观臆想,并非ChatGPT真正有意识。区分这两者是理解ChatGPT的关键。杨立昆教授评价ChatGPT技术创新有限,但工程实现优秀杨立昆认为ChatGPT没有新的科学突破,所用技术大多来源于既有研究,但在工程实现上做得非常出色,将这些技术组合应用,做成可供大众使用的产品。这显示工程落地对技术应用同样重要。ChatGPT可被应用的领域有哪些?ChatGPT的应用领域很广泛,几乎任何依赖语言交互的领域都可以应用,如客服、培训、写作、创作等。它使软件可以直接理解人类语言指令,不再需要通过GUI,将推动语言交互进入新阶段。基于同一套GPT模型API开发的产品,如何进行产品差异化和构建竞争壁垒?不能仅依赖GPT模型本身,而要构建额外的知识库、业务逻辑等。将GPT模型视为工具,自身提供核心价值。还可以建立用户粘性,提供更人性化的交互体验。区别于只提供GI的应用。ChatGPT这一次浪潮,价值捕获最终会落在何处?短期内云服务提供商可获利最大,但长远看应用开发者获得价值更大。类似早期互联网规模盈利主要在浏览器,但最终落到应用和平台。ChatGPT是基础工具,真正价值在于使用它的应用创新。国内外创业者在ChatGPT方面的时间差异?国外先发优势明显,但门已开启,中国可迅速跟进。短期内应掌握工具使用,理解用户需求,积累经验。中长期可补足关键技术,依托大量应用场景优势取得进展。时间差异为中国提供机遇。ChatGPT会让人失业吗?ChatGPT提升生产效率,短期内某些工作可被取代,但长远来看会创造新的就业机会。类似历史上每次科技进步,都存在担心和不适应,但结果是创造新的增长点。重点是积极掌握新技术带来的机遇。会用AI和不会用AI的人之间会形成更大的不公平吗?如果把AI视为专业工具,跟会用Excel和不会用仅存在程度差异,不会导致严重不公平。但如果AI技术被少数人垄断,才可能导致对其他群体不公。因此普及AI教育和访问等对缓解不公平至关重要。ChatGPT生成的内容应该受版权保护吗?这涉及全新领域,尚无定论。合理的态度是 Generates content不应声称拥有原创作品的版权,但他人也无权直接声明其作品属于公共领域。需要相关法律进一步明确界定。ChatGPT背后的语料是否可能涉及侵犯隐私或非授权的数据爬取?ChatGPT本身不涉及隐私侵权或非授权爬取数据。其训练语料来源清晰,主要是公开的数据集。但是基于ChatGPT开发的应用,如果涉及利用用户数据,则其开发者需要遵守相关数据规范。未来互联网会不会充斥着AI生成了大量同质化或平均水平的语料?这是可能的风险,但也可以通过增加训练语料的多样性、建立检索真伪的辅助系统等方式加以规避。重点是积极主动地使用AI等新技术,而不是被动地适应它带来的负面效应。ChatGPT不仅不会像抖音算法那样割裂世界,反而给人类世界大同的可能性ChatGPT训练是词向量加权平均,把互联网内容编织在一起,相对屏蔽个性化偏好。这有助形成共识,而非像抖音等算法强化信息茧房。但它也可能形成主流语料的“Political correctness”,需要保持理性的辩证看待。AI教育的重要性,以及建硕在实践中的瀛海威互联网分享精神普及AI的正确使用方法和BADucation非常重要。建硕本身도坚持以分享的精神回馈社会。瀛海威当年免费开放上网资源,启发了一代人。现在也在向开发者开放免费的ChatGPT使用额度,以助力更多创新应用的产生。三、播客链接前往收听四、扩展知识特德·姜:ChatGPT是网上所有文本的模糊图像