Post
刚才翻了一篇硅谷的论文
说大模型的迭代马上要撞上一堵隐形的墙了
原因挺可笑的:不是缺英伟达的显卡,而是互联网上能被爬取的标准文本数据,基本已经被OpenAI和谷歌这帮巨头给吃干抹净了
现在这帮大模型最眼红的
是物理世界里那些非标的、带口音的、甚至夹杂着地方俚语的「活人声音」
没有这些下沉数据
再牛逼的AI到了亚洲或者新兴市场
也是个听不懂人话的废柴
顺着这个思路,我突然看明白了 @psdnai 刚上的那个 Numo项目在打什么算盘
他们跑去收孟加拉语、印地语、泰米尔语这些小语种的语音数据
表面上看这活儿又脏又累,极其“下沉”
但商业嗅觉极其毒辣
大厂为了让AI卖到全球,正愁买不到这些高质量的本土语料
Numo等于是直接把吸管插在了巨头们最焦虑的这个需求缺口上。
对于咱们这种普通玩家来说,去搞懂大模型的底层代码没意义
但利用这种语料饥渴症来套点利,逻辑是通顺的
去里面录录音、贡献点数据换奖励
如果你恰好还是老Poseidon App的核心用户,还能白嫖个收益乘数
与其在二级市场里去接盘那些估值上天的套壳AI币
不如去干这种最底层的卖水生意
毕竟,大厂永远缺真实数据,这个买单方是逃不掉的。
注:非广 非投资建议 注意风险规避!DROY
Haftungsausschluss: OKX Orbit-Inhalt dient nur zu Informationszwecken. Mehr erfahren
Antworten
Noch keine Kommentare. Schreib die erste Antwort!

