Publicar
Powerpei
Powerpei
刚才翻了一篇硅谷的论文 说大模型的迭代马上要撞上一堵隐形的墙了 原因挺可笑的:不是缺英伟达的显卡,而是互联网上能被爬取的标准文本数据,基本已经被OpenAI和谷歌这帮巨头给吃干抹净了 现在这帮大模型最眼红的 是物理世界里那些非标的、带口音的、甚至夹杂着地方俚语的「活人声音」 没有这些下沉数据 再牛逼的AI到了亚洲或者新兴市场 也是个听不懂人话的废柴 顺着这个思路,我突然看明白了 @psdnai 刚上的那个 Numo项目在打什么算盘 他们跑去收孟加拉语、印地语、泰米尔语这些小语种的语音数据 表面上看这活儿又脏又累,极其“下沉” 但商业嗅觉极其毒辣 大厂为了让AI卖到全球,正愁买不到这些高质量的本土语料 Numo等于是直接把吸管插在了巨头们最焦虑的这个需求缺口上。 对于咱们这种普通玩家来说,去搞懂大模型的底层代码没意义 但利用这种语料饥渴症来套点利,逻辑是通顺的 去里面录录音、贡献点数据换奖励 如果你恰好还是老Poseidon App的核心用户,还能白嫖个收益乘数 与其在二级市场里去接盘那些估值上天的套壳AI币 不如去干这种最底层的卖水生意 毕竟,大厂永远缺真实数据,这个买单方是逃不掉的。 注:非广 非投资建议 注意风险规避!DROY
Poseidon
Poseidon
AI was trained on the open internet, but the data that matters most lives in the real world. Introducing early access to Numo, an app built to collect the next generation of AI training data. Starting with voice data collection in Bengali, Hindi, Tamil, and Telugu. Details ↴

Aviso legal: o conteúdo do OKX Orbit é fornecido apenas para fins informativos. Saber mais

Respostas

Ainda sem comentários. Sê a primeira pessoa a responder!