善意提醒

如果您打开本站很慢,布局排版混乱,并且看不到图片,那么可能是因为您还没有掌握用科学的方法上网的本领。

2025-01-29

DeepSeek风暴过境

图片来自网络,与本文无关

前天晚上,美股大跌。纳指跌了3%以上,然而道琼斯却是红的。不知道出了啥事,去看新闻,才知道原来是美国人听说DeepSeek了。

要说这帮华尔街精英真的是反应慢。DeepSeek的事情就算是流传到大众耳朵里,也已经快一个星期了。现在再来暴跌这么一下,不知道他们是怎么想的。

看走势曲线,我就知道第二个交易日会进行修复,果然今天就涨回去一半。春节连假还长,等中国人重新上班,华尔街那边应该已经把这个事情消化得七七八八了。该咋地咋地,就有如一场风暴过境,一片狼藉之后继续过日子呗。

我不是AI精英,只是一个快退休的程序员而已。DeepSeek在技术上有多牛逼,我不知道,不评论。我只是从我自己的角度,来说说这个事情。


美国人的确善于开创一个新的领域,而中国人的确善于把一个东西给做「烂」。虽然是「烂大街」的烂,但这个「烂」字在这里并不完全是贬义词。让王谢堂前燕飞入寻常百姓家,我完全同意这是好事一件。如果每个人都有「丰饶之角」,那么也就没有政府什么事了。

不过DeepSeek真的很便宜吗?可能倒也未必。官方宣称的训练成本,我是不清楚虚实,但官网上的价格,可不是真便宜。即使打过折,也就比通义千问低一些,一个0.3元,一个0.1元,并没到一个数量级的差别。这还是「缓存中」的情况,缓外的价格要1元,比通义千问的qwen-plus(0.8元)还贵。如果算它的所谓「原价」,那更是比肩通义千问(那又贵又慢)的qwen-max,完全没有价格优势了。
我这里只说了输入价格,输出的情况也差不多,各位有兴趣可以自己去看。

至于效果,如果它只是「赶上」了GPT-4o,那我完全也没有什么好期待的。跟你们人类聊聊天,可能看不出什么来,但如果也像我一样把它作为ToB的服务来用,就会发现所有的LLM都一样。有的聪明,有的笨拙,确实能看出差别。但ToB服务需要的是质量稳定如一。在这一点上,所有的LLM在我看来目前还都还不及格。

ToB的另一个问题,中国式AI可就要命了。
我可以负责任地说,AI相关的工作成本,我目前大部分都花在了对付敏感词上面,而且越来越多。客观地说,敏感词问题,所有LLM也都有,但只有中国式AI特别多,而且弥天漫地,涉及到方方面面。讲个老笑话,中国式AI,只有两个不能说——这也不能说,那也不能说。

比较简单一点的,是把诸如「上游行业」看成「游行」这种。问题出在中国人实在是信不过AI,非要在其输入前面和输出后面各套一个敏感词过滤系统。这也就是法新社试下来发现有时候能突破,随即AI又改口的原因。ChatGPT当然也有这种现象,不过相比起来,中国式AI的容错率要低得多。公司也好,政府也好,在这方面完全「输不起」,所以也就格外地烦。

输入有敏感词还好,输出有敏感词,真的是令人恼火。因为输出不能给你看,你也不知道敏感词是什么。有的AI模型多试两次能绕开,有的死活不能。提工单吧,万一AI改了一种说法,可能还不一定能稳定重现。客服说在prompt内加上「请避开敏感内容」,但是在今天的中国,比起模型更新速度来,敏感词的变化可是要快多了。

可能是因为时局原因吧,我最近这半年遇到的敏感词问题,特别是输出敏感词问题,比之前要多得多。主观感觉上,2024年最后一个季度比起前面大半年,出现的频率明显变多,大概有三、四倍的样子。偏偏金融行业,几乎躲不过中国的敏感词问题。DeepSeek再牛逼,如果解决不了这个问题,在商用的时候一样会遇到麻烦。道理很简单:你再便宜,成本再低,一个问题需要客户重复三五遍,白菜也给盘成肉价钱了。

说到底,DeepSeek眼下貌似成功的地方,和将来可能会失败的地方,都跟实体经济领域的情况别无二致。太阳底下无新事。我看得出,别人也看得出。「开源」目前看来是一步不错的好棋,不管结局如何,起码将来在历史上会有一席之地。只是,希望是真正的开源就是了。

太阳底下无新事。

没有评论:

发表评论