
【 06 | https://www.vava8.com/index.php?app=self&act=edit_article&article_id=45271 】
【虫言人间】07 | 汉字,汉语言,汉文化与AI时代 -(4)AI与汉语文字功能
昨天第三部分发完后,@仁剑 君补充归纳了汉字的一些优点,其中让老外前赴后继牺牲的汉语四声是我前面忘了说到的。
汉语的四声把原本已经很高的效率的更是在口语交流中翻倍。而汉字的单音节表意能力让它在添加音节(字)时的表意功能指数及提升。
所以汉字无论在效率还是利用率,复用率上都一骑绝尘。而这种多维非线性的结构更使让从小用汉语的人的思维能力得到持续的锻炼提升。
另外一个我想说的点是,前面所说的汉字的一些局限性或者缺点,其实也和与中文的‘话语权’紧密相连。一个落后的中国支撑不起汉字在科学界艺术界应有的地位,即使这个世界上有11亿人说中文。
然而,世界正在变化,中国正在迎来一个重新辉煌的时代,整个中文世界的影响力也在同步提升,同样地位得到提升的还有中文本身。
没有一件事的发生是偶然的。AI时代的到来汉字汉语的优势,包括曾经为认为是劣势的优势,也被狠狠的注意到了。
AI的核心元素之一是大语言模型(LLM),恰巧大语言模型并不完全依赖传统语法逻辑。它重视的是:
-- 语义关联,上下文,模糊联想,意象网络,等等
– 简言之:神叨叨
而这恰恰是汉语长期擅长的东西。
与此同时,这些年来中国互联网也发展出一种独特的极高密度的信息表达:
-- 缩略语,梗,表意的压缩,多层次双关,等等
– 简言之:鬼畜畜
AI时代最重要的变化就是,机器第一次还是处理“语义”而不仅是“语素:。
传统计算机本质上是“逻辑机器”,因此那个时代适合的是:
-- 明确的规则,精确的语法,严格结构化的语言
所以,站天然优势的是:
-- 拼接文字,数学符号,编程语言
LLM却不靠理解语法规则工作,而更像在海量于一关联中预测后续最可能出现的结果,像极了人类大脑。
它处理的核心是:
-- 关联,上下文,模糊语义,隐含关系从,多层意象。
而这些恰恰是汉语生来就非常擅长的部分。
高语义密度的汉语的另一个杰出优势是语言效率。
撇除英语对语法结构,时态,连接词的依赖,大量依靠上下文关系,语境(语义场景),语感和关系联想,等等,更加上通过认知共识而达到的高度压缩,比如:卷,滚,牛!SB(这个算汉语)等,汉语对AI的贡献是用效率换取对算力的要求。
照例,谜语对联打油诗这些“雕虫小技”是【吃毛虫的皮皮虾】不可能忘记的话题。
如果把范围进一步缩小到对联,谜语、诗词、双关、拆字、意境表达,等等,那么汉语在AI时代的优势,可能比很多人想象得还大。
因为这些东西本质上都不是“标准逻辑任务”,而是高密度、多层关联、强文化语境的语言生成任务。也就是大语言模型最擅长、同时也最能体现汉语独特性的领域。
汉字的“多维结构化审美”让AI在生成对联时,天然适合处理这种模式的对应,关系的对称,高维度约束生成。
因为Transformer本来就擅长长距离token关系匹配。所以AI写对联,往往会比写长篇哲学更“惊艳”。
所以,对联非常适合LLM的结构优势。当然,如果要求特定语境和心情,目前似乎还不大灵光。
谜语呢?
谜语与汉字,是AI最容易“感到神奇”的地方之一。
汉字谜语,本质上不是逻辑推理,甚至是反逻辑的。它是图形、语音、意义、文化联想的混合游戏。
举个例子:一口咬掉牛尾巴 = 告
这里有图形拆解,空间结构,汉字组合。
再比如:半部春秋空对月(皮皮虾原创)= 秦腔
这是文化典故+文字结构共同作用。
这类东西过去传统计算机很难处理,因为它不是严格规则,没有固定公式,但大模型由于见过海量汉语材料,开始能够“模仿性理解”这种关联。
于是AI第一次开始接近中国传统文字游戏。这是很有意思的文明时刻。
再说诗词: 诗词可能是汉语与AI结合最强的领域之一.
原因很简单:诗词本来就是高压缩语言生成。这是LLM的本质,它们天然契合。
汉语诗词的信息密度之高,让外国人无法想象。
例如:孤舟蓑笠翁,独钓寒江雪。
二十世纪很多西方汉学家都惊叹:
为什么十个字里能塞进这么多信息:人,船,雪,空间,温度,孤独感与时间感。
因为汉字是意象压缩单元,自带多重维度。AI在这种任务上非常容易,只需要海量积累上的模仿就能生成“看似有诗意”的内容,用零散汉字形成情绪场。
而神经网络恰恰最擅长关联意象。因此AI写中文诗,会比英文诗更容易产生“氛围感”。
其实更恐怖的是AI可能会把中国古典语言游戏推到历史新高度。
过去写诗词、对联,需要长期训练,背诵,规则记忆,大量典故积累,所以它属于少数文人的能力。至少也是我爸爸那样的理工文艺男。
但AI出现后,一个普通人也能瞬间写律诗,对对联,填词牌,做藏头诗。。。
这意味着中国古代高度精英化的文字游戏,第一次被大规模民主化。
这是非常巨大的变化。
它也有它的致命之处:
因为AI特别擅长“形式上的中国味”,但未必有真正生命体验。
于是未来可能出现大量“技术上像唐诗,但灵魂上像草纸文案”的东西。
而中国古典文学最深处,恰恰不是技巧,而是人生重量,历史感,命运感,与大自然共呼吸的精神形态。
杜甫之所以超越AI,不是因为他会对仗,而是因为 “国破山河在”的真实体验。
那么小说电影呢?
问题来了。上一篇说过汉语的优势在小说电影舞台剧这些语言累积份量大的艺术形式上就不明显了,AI则更糟糕。
归根结底,AI是'搜肠刮肚'式的找信息拼凑,不是创作,虽然'肠肚巨大,所以它在较短文字内容的'创作'上容易不露馅,但长的文章就把不住灵魂,极度容易漂移方向,失去风格基点,趋向网络'主流'。
我试过让AI帮我续写【中篇连载】,结果惨不忍睹,一下子就走向‘霸总’风格,胡说八道。
这些以后会慢慢技术性的有所提高,表面上能骗人多一点,但是基本原则无法改变。
AI无法有人的生活体验,只有文字记录化了的那部分浅层。
杜甫永远比AI深刻。
【 08 | https://www.vava8.com/index.php?app=index&act=view&id=46422 】