要想一切保持不变，就必须改变一切 – 知玄创始人张迪关于中文语言模型应用的思考

2024-05-28 15:31:22 中华网科技

　　“本质上，互联网内容和生命一样，受进化论支配。其存在标准只有一条：那就是以尽可能低的成本争取尽可能多的注意力。” – 选自被和谐网文《中国互联网正在加速崩塌》

　　当我写这篇关于模型应用的文章时，刚好读到了上面这段文字。作者的核心观点是，由于经济规律与自我审查，导致国内互联网内容已经出现系统性与大规模消失。文章结论是否正确先放一边，但语言和文字作为内心想法的外化，却是传递一个社会运行状态的信号。不准确的表述会导致信号严重失真，造成人们对环境的误判。加之当下的国内语言模型存在大量被污染的中文语料，又极易触发敏感词……

　　这一切都让我对作者的观点深以为然。

　　败也中文，成也中文–利用AIGC创造价值

　　斯坦福大学历史系教授墨磊宁在《中文打字机 – 一个世纪的汉字突围史》中说，从19世纪初开始，中文就被卷入了一个新的全球信息秩序。世界上主要语言发音都是黏着语或屈折语，唯有汉语是单音节发音，每个汉字都是独特的表意文字，她“自成一体，极难拉拢“。

　　黑格尔在《历史哲学》(The Philosophy of History)中认为，中文书写的本质“从一开始就是对科学发展的一大阻碍”。他认为中文语法结构难以表达现代思想，用中文思考和交流的人受这门语言限制，始终无法登上进步的历史舞台。中国人被一种与现代思想格格不入的语言掌控，在慢动作中运转……

　　语言兼心理学家布卢姆也称，由于中文语言没有虚拟语气，所以使用中文的思想家无法进行“反事实性的构思“，继而限制了他们构思和提出假说的能力，而这种能力对科学和创新发展来说至关重要……

　　总之，中文这种语言引起的思想孤立，让“中国人变得自负和自我依赖，冻结在时间里，抑制了中国的进步。”

　　虽然这些说法极端且短视，但这足以证明中文在表达和输出上的复杂。

　　随着人工智能技术的普及，将深刻影响人们对文字、技术和现代性的文化想象。AI大语言模型作为革命性人机交互的新模式，要求创作者比任何人都更需要顺应时代。其实文字传达给人的信息量是视频的千百倍，视频特效和技术越发达，人们就越容易产生视觉疲劳，人们就越会意识到：文字才是这个世界上最大的虚拟现实。

　　生活中很多东西都和文学有关，文字并未“死去”。既然中文在历史上从未弯道超车，那就努力在终点超越。新的人机交互方式在人、人工智能和语言之间建立一种全新关系，让“随机应变”也被赋予了新的涵义。不知不觉间，创作者在大时代来临时已经慢慢参与到某一段内容的秩序里，成为一段历史性对话的参与者。

　　数往者顺，知来者逆- 在AIGC时代回归文字

　　一个自称新闻学教授的网友在知乎留言：“传播学的基本理论就是几个废话一样的模型，从18世纪到今天没有任何进步。所谓品牌规划、传播矩阵不过是老调重弹……”

　　听上去有些冒犯，但也不是全无道理。

　　我们从2020年开始招聘，沟通了成百上千个与创作岗位有关的人，其中以新闻传播和汉语言文学专业占比居多。很多人自诩写过大量内容，从自媒体、公众号到小红书;从头条、豆瓣到论文……尝试合作后发现，真正具有创作能力，让一篇文章做到逻辑自洽、前后呼应且文通字顺，能够商用的寥寥无几。一篇条理清晰、不足千字的普通新闻类内容，往往可读性不高，生涩感十足。

　　一边是AI能力飞速迭代，一边是高等教育原地踏步，这就是当下我们面对的现实。

　　曾任美国国家工程学院院士、电脑协会主席，参与过曼哈顿计划，图灵奖获得者兼数学家理查德.汉明，在1997年出版的《科学与工程的艺术》(The Art of Doing Science and Engineering)书中提到，从牛顿时代开始，人类知识平均每隔17年左右就会翻倍，每15年就会有一半知识过时。除了知识，他还预测我们的媒体和信息获取量也将指数级增加。汉明认为三十年后，当一名大学生的事业顶峰来临时，技术知识已经翻了四倍，他的子女将面临无穷的媒体内容与势不可当的信息量……这本书完成于上世纪90年代，如今30年过去，现实不仅印证了他的预测，还有了几乎具有碾压一切力量的生成式人工智能。

　　再看一组数字。2023年全国有1,158万应届毕业生，文科生占比约40%。有数据统计，人文社会学科毕业生就业比例低至12%。也就是说，在近460万文科生中，仅有不到60万人有工作，超过400万文科生面临“毕业即失业“的严峻现实。

　　Open AI推出了最新的ChatGPT 4o，微软也紧随其后宣布最强AI电脑Copilot PC，阿里巴巴的通义千问降价97%、科大讯飞宣布讯飞星火 Lite API 永久免费开放……人工智能一日千里，很多人除了欣喜还有焦虑。以前辛辛苦苦绞尽脑汁学到的东西被AI完爆。

　　在这个AI进化比人快得多的时代，用脑工作的人正逐步被边缘化并慢慢淘汰，今天的工作更需要用心，每个人必须比AI跑得快才可以。

　　所以我们总要做点什么。

　　在我们对未来一片迷茫的时候，回头在中国古老的智慧结晶中寻求答案总会没有错。《易经》里说：“数往者顺，知来者逆“。你如果想知道未来怎么办就得逆着来，往前走的同时要回头看。只要人类还需要自我申辩、彼此沟通、澄清事实和对外传播，文字这种古老的表达方式就不会过时，也永远不会被淘汰。

　　有句话叫“大象无形”，AIGC打通了很多东西。人和AI都是遇强则强，遇弱则弱，需要反复“挑战”。

　　如果理科生是大语言模型的发明者，那文科生就是这个应用的布道者。

　　被动积累，主动执行–用AI撬动Big Ideas

　　今天，很多企业和个人都身陷“AI焦虑”，在人工智能面前无所适从，想做些什么又不知从何下手。

　　你可以把AI视为一个能为业务赋能的“杠杆”，而这个杠杆的支点并不是那些所谓的最新工具或技术。因为这些技术除了自己更新迭代，终归会被其它AI消灭，从技术角度出发的AI产品被更高阶的技术替代是它本身的宿命。所以杠杆的支点往往来自那些最基础、最核心的知识和底层逻辑。只有最基础的东西才最具有杠杆力，因为它们是经过长时间筛选被验证过的。

　　查理.芒格把核心知识叫做Big Ideas，今天我们要做的就是找到并学习这些Big Ideas. 虽然它们是基础知识，但本质上它们是更难被理解的高阶知识，是那些基于一个事物或行业最基础、最本质理解产生的想法。“道可道，非常道”，要真正理解需要内化的经验和深入思考。

　　AI同时模糊了专业界限，它也在加速减少工具和行业数量。每个人都面临一个从领域里的执行者到跨领域的决策和创作者的身份转变，完成不了这个转变就会被淘汰。所以不管愿不愿意，未来很多人都必须要跨专业才能生存。

　　从理解语言到写代码，AI的能力几乎在所有方面都超越了人类基准。这个世界已经悄然从“答案举足轻重”变成了“问题至关重要”。在这个人工智能被普遍应用的当下，它们有时候是我们的同事，有时又成了竞争对手，有时是员工，有时甚至还是老板……但无论它们是什么，AI都会持续把自己嵌入一切，最终无处不在。

　　“知道正确的问题比拥有答案难得多”。学会更聪明地提问，将可能成为在今天这个AI掌权的世界里，新的个人生存法则。从现在开始，无论你的内心是否真正完全接纳人工智能，她都会慢慢浸透到你工作和生活中间。所以现在就用AI开始积累，用她帮助你提升效率和生产力，最终用团队的执行力让她发挥最大价值，这才是企业当下最该努力的方向。

　　意大利作家兰佩.杜萨在小说《豹》里有一段对白，一个贵族对另一个贵族说：“我们要想一切保持不变，就必须改变一切”。这段发生在19世纪中叶西西里岛的对话，对于我们今天所处的这个AI时代，依然没有过时。

　　也永远不会过时。

知玄张迪

分享到微博分享到微信

要想一切保持不变，就必须改变一切 – 知玄创始人张迪关于中文语言模型应用的思考

相关阅读

新动态

关注度

最话题