2023-3-22 15:0
开篇 | 狂飙 2023 —— AIGC 的 Big Bang 时刻
本文写作期间,我循环播放《太阳照常升起》《Cornfield Chase》。没有这两首音乐,我大概率无法完成写作,因此开篇致谢,并建议读者手动播放 BGM。2022 年 11 月,OpenAI 发布了 ChatGPT,在之后的很长一段时间,ChatGPT 并未获得其应有的热度,直到春节过后,当大多数打工人走出三年口罩的阴霾,重返工作岗位,被各种信息流狂轰滥炸并亲自体验之后才发现 —— 我工作可能要没了?ChatGPT 百度指数 | 中国地区ChatGPT 谷歌指数 | 美国地区之后便是 AI 「狂飙」的 50 天。在这不到两个月的时间里,我亲眼见证了 NewBing、GPT-4、文心一言、Microsoft Copilot 等等产品的发布,深度体验了许多工具和实例,自己写了点代码,分享了一些看法,收获了许多交流。也正因此我更加坚信,2023 年的当下,就是 AIGC 的 Big Bang 时刻。也许有很多非计算机专业甚至非理工科的朋友,至今仍不明白科技界为何狂欢,不明白有的人为何恐惧。那就让我带着你,从头开始聊。一、AIGC —— 数字文明的内容生产方式我拉了几个 AIGC 的交流群,经常有人进来就问:这不是 ChatGPT 的群吗?AIGC 是啥意思。AIGC —— Artificial Intelligence Generated Content,人工智能生成内容,字面意思非常简单。但是想探个究竟,我们至少要从三个角度来聊。内容是什么?内容,即某种形式的表达所包含的实质性信息。形式,即是内容的载体,可以是文字,可以是图片,也可以是音频、视频,甚至是可以沉浸体验的游戏。换句话说,以这些形式进行记录、表达或演绎时,其中蕴含或传递的主题、信息、意义就是内容。内容如何产生?内容产生的过程就是信息的传递、思维的表达和情感的流露。古人说:「言为心声,字为心画」,便是这个意思。不论图文音视,我们总是要先有一个意图思路,再通过合适的方式进行创作表达。比如我写专栏便是在生产图文内容;剧组拍电影是在创作视觉内容。同时,内容的内核在于思想,而合适的形式可以让思想展现的更淋漓充分,可以让受众接收的更简便直观。因而,我们看到了许多内容形式之间的转换——外语翻译成汉语;看图讲故事;为故事画插画;小说改编成电影;电影改编成游戏,等等。所以,从这个角度上,内容也分成自己原创的内容和形式转化的内容。互联网数字内容生产方式的演变—— PGC → UGC → AIGCPGC:Professional Generated Content(专业生产内容)UGC:User Generated Content(用户生产内容)AIGC:Artificial Intelligence Generated Content(人工智能生产内容)这个演变过程是时间线上自然发生的,是生产力极大提高后带来的内容爆炸。不过要注意到的是,这个过程中并不是完全替代的关系,而是后来者数量过大导致比例的稀释和话语权的转移——UGC 时代依然有 PGC,但是占的比例更低,大家的注意力分散在微博、抖音、朋友圈,因而 PGC 的话语权削弱了;AIGC 时代依然会有 PGC 和 UGC,只不过——我们会被 AIGC 内容淹没包围,越来越真假难辨,互联网真正进入「屎里淘金」的年代。(注:也有一些人认为这个变化的过程对应了 Web 1.0 → 2.0 → 3.0,我对 Web3 实在没什么认知见解,这个话题就不展开了。)结合上面说到的形式转化,我简单画了个图:目前的各种模型和工具,主要还是以文字为中心做的互相转化,几个例子:ChatGPT:接收文字,生成文字;(GPT-4 就增加图片能力了)Stable Diffusion:文生图,图生图;Speech To Text:语音转文字(讯飞、飞书妙记、智能字幕)Text To Speech:文字转语音(AI机械配音)…等等。到此,我们可以解答群友的问题,为什么 AIGC ≠ ChatGPT,因为(现阶段的)ChatGPT ⫋ AIGC。看完以上三个问题,再回到这一节的标题:为什么我说 AIGC 是数字文明的内容生产方式。因为数字内容培育起数字文化,数字文化诞生出数字文明,文明需要海量的内容基础,AIGC 可以帮助我们极快速地构建这个虚拟世界。(其中自然也有需要治理的问题,不再赘述。)二、2023 —— AIGC 的 Big Bang (大爆炸) 时刻现在我们可以来聊一聊 ChatGPT 了。NVIDIA 的老黄说,ChatGPT 是 AI 领域的 iPhone 时刻,我倒觉得他格局小了。现在,眼下,就是 AI 领域的大爆炸时刻。这一部分没有什么干货和观点,所以我就不往远处追溯了,我们就往前数一周时间:3 月 14 日:Stanford 发布 Alpaca7B;清华大学发布 ChatGLM-6B;3 月 15 日:OpenAI 发布 GPT-4;Google 发布 PaLM API。3 月 16 日:百度发布文心一言;微软发布 Copilot;Pytorch 2.0 发布;Midjourney V5 发布。3 月 21 日:Adobe 发布 Firefly;Runway 发布 Gen2;微软 Bing 支持免费 AI 绘画;Google Bard 开放体验。这还只是我自己关注到的部分信息,不包括在此基础上开发衍生的无数产品。为了验证不是我孤陋寡闻井底之蛙,或者我活在信息茧房中不了解行业发展,我专门去请教了两位业界朋友:问:你们 AI 领域没有瓶颈的吗——Q1 发布这么多产品后半年不过了?答:上一个瓶颈刚刚突破,下一个瓶颈还没那么快到来。问:我如果把最近 10 天形容成「AI 领域的大爆炸时刻」,夸张吗?答:不夸张,没什么问题。在可以预见的几个月内,我们就会体验到 Office Copilot,就会见到真正的多模态大模型。今年甚至有希望能看到 GPT-5。AI 的爆发也会赋能各行各业,今年所有行业都将疯狂加速。如此盛况,未来已来。三、入局 —— 我们该做些什么?关于如何面对 AI、使用 AI 甚至抵抗 AI,不同的人自然有不同的看法。一个还在读博的朋友跟我这样形容:「眼前就是大浪拍过来的既视感,我就是站在岸边被大浪吓傻挪不动脚的人。不知道这波浪会把我淹死,还是把我的裤衩冲下来。」(Generated by Bing, prompt: a man standing in front of a big wave tide.)而我,在经历了一次又一次情绪振奋和 emo 的转换之后,思考了许多,挣扎了许多,推翻了许多,平和了许多:这件事很难,但还是要做。这件事很难——这是我的处境,也是大家的处境;但还是要做——这是我的选择,也希望会是大家的选择。我现在最大的感想就是,从今以后,信息鉴别能力和工具使用能力会越来越重要——人跟人差距会比人跟猴子的差距还大,未来人跟 AI 的差距会比人跟草履虫的差距更大。那我们怎么做,做什么?通过这个专栏,我希望能告诉大家、帮助大家、教会大家的一些事——少做无谓的事情。什么叫无谓的事情呢,比如我本打算统计最近一个月我在知乎关于 AI 的内容写了多少字,这可能需要花十几分钟时间来写脚本并手动剔除无关回答,但不论最后的结果是 5 万,10 万,还是 20 万,其作用只是拿来装一个一次性的 X 罢了;再比如,在微信群里辩经 —— 真理有可能越辩越明,但不是发生在微信群,热衷于说服别人,有什么意义呢?诸如此类的事情,我以后少做,你也少做。用好准确的信息。从今以后我们可能再也不会缺乏信息了,准备好迎接真正的信息爆炸时代吧。想要利用好信息,第一是获取,第二是分辨,第三是使用。筛选自己的信息渠道,改善信息焦虑和精神内耗,培养批判性思维和艺术鉴赏能力。随着 AIGC 拉低了创作门槛,这些能力要远远比创作能力重要。做出有益的尝试。保持旺盛的好奇心,不要自以为什么都懂而对已经在发生的变革熟视无睹,一个新鲜事物能迅速破圈必然有其道理,而不要简单地否定,不要忽视「房间里的大象」。体验一些产品,学习一点编程,做出一些改变——纸上得来终觉浅,绝知此事要躬行。思考人类的将来。我希望自己,也希望我们,眼界宽一点,格局大一些,抬头看天,低头看路。AI 带来了很多前所未有的思想冲击和哲学问题,不一定都能想明白,但思考好过愚钝。过好自己的生活。调节情绪,减少内耗,回归生活。信息再多,记在脑子里才是自己的;工具再多,自己用到了才是生产力。我们一个人,对抗不了全世界,不可能吸收所有知识。AI 为我所用,我能用到的认真学习,用不到的暂且搁置。最后。与我的长辈不同,我没有经历过煤油灯到电灯,书信到 BP 机的转变;也无法体会盖茨所说的第一次见到 GUI 的震撼;iPhone 很好,很强,但我们也已习惯。而 AI,真的是我此生未有的思想颠覆。面对历史进程的滚滚车轮,我们该怎么办呢?留一个小作业吧:开篇我放了两张数据趋势图,图中有哪些值得关注的信息?如何解读?