![]() |
| 图片来自网络,与本文无关 |
前天晚上,美股大跌。纳指跌了 3% 以上,然而道琼斯却是涨的。不知道出了啥事,去看新闻,才知道原来是美国人听说 DeepSeek 了。
要说这帮华尔街精英真的是反应慢。DeepSee k的事情就算是流传到大众耳朵里,也已经快一个星期了。现在再来暴跌这么一下,不知道他们是怎么想的。
看走势曲线,我就知道第二个交易日会进行修复,果然今天就涨回去一半。春节连假还长,等中国人重新上班,华尔街那边应该已经把这个事情消化得七七八八了。该咋地咋地,就有如一场风暴过境,一片狼藉之后继续过日子呗。
我不是 AI 精英,只是一个快退休的程序员而已。DeepSeek 在技术上有多牛逼,我不知道,不评论。我只是从我自己的角度,来说说这个事情。
美国人的确善于开创一个新的领域,而中国人的确善于把一个东西给做「烂」。虽然是「烂大街」的烂,但这个「烂」字在这里并不完全是贬义词。让王谢堂前燕飞入寻常百姓家,我完全同意这是好事一件。如果每个人都有「丰饶之角」,那么也就没有政府什么事了。
不过 DeepSeek 真的很便宜吗?可能倒也未必。官方宣称的训练成本,我是不清楚虚实,但官网上的价格,可不是真便宜。即使打过折,也就比通义千问低一些,一个 0.3 元,一个 0.1 元,并没到一个数量级的差别。这还是「缓存中」的情况,缓外的价格要 1 元,比通义千问的 qwen-plus(0.8 元)还贵。如果算它的所谓「原价」,那更是比肩通义千问(那又贵又慢)的 qwen-max,完全没有价格优势了。
我这里只说了输入价格,输出的情况也差不多,各位有兴趣可以自己去看。
至于效果,如果它只是「赶上」了 GPT-4o,那我完全也没有什么好期待的。跟你们人类聊聊天,可能看不出什么来,但如果也像我一样把它作为 ToB 的服务来用,就会发现所有的 LLM 都一样。有的聪明,有的笨拙,确实能看出差别。但 ToB 服务需要的是质量稳定如一。在这一点上,所有的 LLM 在我看来目前还都还不及格。
ToB 的另一个问题,中国式 AI 可就要命了。
我可以负责任地说,AI 相关的工作成本,我目前大部分都花在了对付敏感词上面,而且越来越多。客观地说,敏感词问题,所有 LLM 也都有,但只有中国式 AI 特别多,而且弥天漫地,涉及到方方面面。讲个老笑话,中国式 AI,只有两个不能说——这也不能说,那也不能说。
比较简单一点的,是把诸如「上游行业」看成「游行」这种。问题出在中国人实在是信不过 AI,非要在其输入前面和输出后面各套一个敏感词过滤系统。这也就是法新社试下来发现有时候能突破,随即 AI 又改口的原因。ChatGPT 当然也有这种现象,不过相比起来,中国式 AI 的容错率要低得多。公司也好,政府也好,在这方面完全「输不起」,所以也就格外地烦。
输入有敏感词还好,输出有敏感词,真的是令人恼火。因为输出不能给你看,你也不知道敏感词是什么。有的 AI 模型多试两次能绕开,有的死活不能。提工单吧,万一 AI 改了一种说法,可能还不一定能稳定重现。客服说在 prompt 内加上「请避开敏感内容」,但是在今天的中国,比起模型更新速度来,敏感词的变化可是要快多了。
可能是因为时局原因吧,我最近这半年遇到的敏感词问题,特别是输出敏感词问题,比之前要多得多。主观感觉上,2024 年最后一个季度比起前面大半年,出现的频率明显变多,大概有三、四倍的样子。偏偏金融行业,几乎躲不过中国的敏感词问题。DeepSeek 再牛逼,如果解决不了这个问题,在商用的时候一样会遇到麻烦。道理很简单:你再便宜,成本再低,一个问题需要客户重复三五遍,白菜也给盘成肉价钱了。
说到底,DeepSeek 眼下貌似成功的地方,和将来可能会失败的地方,都跟实体经济领域的情况别无二致。太阳底下无新事。我看得出,别人也看得出。「开源」目前看来是一步不错的好棋,不管结局如何,起码将来在历史上会有一席之地。只是,希望是真正的开源就是了。
太阳底下无新事。







