HomeProduct Daily
Product Daily

Product Daily

@刘英滕

互联网见闻、不成形的思考、个人成长/职业规划。
订阅8
文章587
最后更新:2024-2-8 12:25
查看 【Product Daily】 详情查看 【刘英滕】 主页
分享到微信打开

免费内容

2023-3-26 18:30

AIGC 发展方向的思考(二)

ChatGPT 的 Plugins 市场发布,让我们对它的定位看得更清晰了——ChatGPT 专注于通用的自然语言理解能力,并把这个底层能力作为一个基础设施,让更多第三方应用可以执行末端的操作和输出,真正渗透到各种应用场景里。想象一下,随着自然语言理解能力再进化,瓶颈是什么?我觉得是人类的自然语言。因为“输入”的再前一步,其实是我们大脑的想法!是先有“想法”再到“输入”再到 AI。语言本身就有折损简单的例子,我们去理解 80 这个数字,就是“八十”。而在法语里,80 是 quatre-vingts,即“四个二十”。复杂的例子,每种语言都不完美:有的语言不能表达出某种情感、某种动作,因为背后的“文化”不同我们偶尔遇到,某个词用英文可以表达,但中文不知道怎么说有些语言没有接触最现代社会,导致没有很多特定词汇。比如当时清朝闭关锁国,日本更早接触西方,所以“哲学”、“世界”、“民主”这些词其实都是来自日语,也被称为“和制汉语”,当时的清朝压根就没有这些词。不是每个人有足够好的表达能力有一个概念叫“X-Y 问题” https://coolshell.cn/articles/10804.html1)有人想解决问题 X 2)他觉得 Y 可能是解决 X 问题的方法 3)但是他不知道 Y 应该怎么做 4)于是他去问别人 Y 应该怎么做?简而言之,没有去问怎么解决问题 X,而是去问解决方案 Y 应该怎么去实现和操作。于是乎:1)热心的人们帮助并告诉这个人 Y 应该怎么搞,但是大家都觉得 Y 这个方案有点怪异。 2)在经过大量地讨论和浪费了大量的时间后,热心的人终于明白了原始的问题 X 是怎么一回事。 3)于是大家都发现,Y 根本就不是用来解决 X 的合适的方案。很多人不能清晰把自己的想法、事件的上下文完整高效表达出来,更不论是传达给 AI。包括我这篇文章,也没有 100% 地表达出我脑子的想法。所以现在为什么冒出这么多 prompt 的参考建议网站,教你怎么跟 AI 对话、拿到更满意的输出。比如:https://prompthero.com/https://prompt.noonshot.com/当然了,有人认为 AI 可以强大到,通过只言片语就猜到你的真正想法,就类似产品经理去做用户调研、分析用户真正动机。但是,这总归没办法掌握一次对话的全貌。会有更好、更终极的解决方案吗?脑机接口我现在算是更深刻理解为什么 Elon Musk 想推这件事。把自然语言干掉,直接捕捉大脑里的信息,直接降低从想法到输入的折损。发明一种新语言一种新的、跟 AI 能更好的交流语言,让人类去学习,甚至会影响到未来人类与人类之间的对话。可能这个方案更现实一些。两种手段都是为了减损,把“想法”到“输入”再到 AI 的过程,让“输入”更高效。但他们都不是短期方法。在这一两年提升大家的输入水平?怎么更好地跟 AI 沟通、用好 AI?应该有一些产品机会。

2023-3-26 18:23

AIGC 发展方向的思考(一)

飞书上周发布会,只字未提 AI,让我有些意外。比如 AI 跟飞书套件的联动,飞书妙记的一键总结、或者类似 notion AI 的文档编写建议,一概没有。会是有什么原因?几个猜测:不符合产品宣传定位;跟中美竞争有关,有意不发布、隐藏实力;来不及,技术还没跟上;作为“先进组织”的 slogan 和产品定位,加上 AI 的热度势头,即使发布一些简单产品,也足以获得不少好感。所以不可能是产品定位原因。而去年,美国政府已经限制了高端 GPU 的出口,最近中美竞争波及 TikTok,如果字节再在 AI 上有大迈步的动作,恐怕有进一步影响。又或者不想喂数据给 OpenAI,涉及很多企业核心机密,这方面可能有所考虑。但更可能的原因,我认为应该还是来不及。OpenAI 之前是作为非盈利组织存在,直到最近两年微软注资才开始商业化。但整体的组织方式,出发点都是纯粹研究好这项技术,而不是非得要有什么落地。这在 OKR 考核、要求短时间出业绩背景下的字节,固然很难诞生。即使是飞书妙记会议总结这种那么接近自然语言理解的场景,也一定会加上类似“帮助 bd 多少企业版客户”的商业化指标,没往模型那块去想,这是落地性太强所导致的负面作用。但我认为字节还是很有机会跟上的,因为大模型的核心是训练数据量,并且是清洗后的数据量。GPT-2 稍微展露头脚,就是训练数据量的提升导致的质变,而近几个月的 3、3.5 到 4,同样是训练数据量的量级提升。字节的推荐引擎(头条+抖音),拥有不输的数据量和经验,全球最大的内容审核团队也能为之所用,而工程能力更加是不差。更大的影响因素,可能是决心和商业逻辑。

2022-9-1 1:18

巴菲特“80/20时间管理法则”

我们总是有很多事情想去做,但显然是做不完的,总觉得时间不够,不做又会让自己陷入焦虑里。80/20 法则就是,列出你想做的 25 个目标然后挑出最优先的 5 个,剩下的 20 个不是“少做”这么简单,是直接列入“不惜一切代价都要避免”的清单,坚决不要做,一旦动了想法就直接拒绝。他自己的实践就是,不接受媒体采访、不参加行业活动、不跟分析师交流,不像是传统的投资人。虽然这些事情能带来好处,但也占用了很多时间,所以坚决不做。我的实践是,坚决不录播客,即便身边很多朋友尝试、近两年变得流行,但自己没有足够的内容输入,时间不够,口音也不好,所以想也不多想。还有坚决不搭独立的个人网站,虽然独立站有很大发挥空间、满足个人的“自留地”念想,但维护网站服务器域名本身要精力,要额外宣传,不如集中到主流社交网络,在微博简书公众号来写。https://mp.weixin.qq.com/s/9QkfpiTZoBlY3zE9KyzRwQ

2022-8-30 9:59

Nreal 简单体验

买了 NrealAir 来体验了下,没有 kol 评测说的那么神。原本期待的是投屏模式,随身戴了一块大屏幕的这个场景。1. 首先从原理上,类似于在你十米远的地方,放了一块一两百寸的屏幕。所以近视是看不清的,200 度就必须要配镜片或者戴隐形了。2. 但实际视野还是很狭窄,Nreal Air 的 FOV 只有 46 度,稍微转一下头就发现边界。(Nreal X 有 52 度,但应该提升有限。)所以为了保证显示效果跟稳定性,就会缩放。如果是坐在椅子上低着头,等比 17 寸屏幕,如果办公正常坐姿,等比 24 寸屏幕,如果朝远处看,等比隔三米远的一个七八十寸电视。画面没有明显扩大。3. 它不能作为拓展屏幕,只能作为唯一的屏幕。因为戴上眼镜后,其他屏幕会有彩色反光现象,且眼镜镜片会阻挡你看别的屏幕。相当于能看其他屏幕,但很不方便。4. 分辨率不算拉跨,但画质不是关注点,因为画面已经跟现实世界已经结合了,画质甚至下降。就跟你不会追求一个骨传导耳机的音质类似。5. 这种显示方式,确实眼睛要更累,白天亮度调高之后是足够的,但也更伤眼和耗电、发热。6. AR 空间模式,等于使用 Nreal 自己的 app,第一方只有相册、浏览器,第三方开发者也很少,爱奇艺、抖音快手、还有一些益智类游戏,第三方应用要单独再安装。交互有新颖的地方,但也有学习和操作成本。总体来说,能当一块随身携带的、很轻便的、但也只稍微大一点点的屏幕,体验提升有限。我更愿意类比作 iPhone 一代或者 HTC G1,确实是个全新形态的物种,但才刚刚开始。